instituto politecnico nacional unidad profesional...

21
INSTITUTO POLITECNICO NACIONAL UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGIA REPORTE FINAL Control de bioprocesos descritos por ecuaciones diferenciales parciales utilizando redes neuronales y modos deslizantes 01/01/2009

Upload: dinhxuyen

Post on 04-Nov-2018

221 views

Category:

Documents


0 download

TRANSCRIPT

INSTITUTO POLITECNICO NACIONAL

UNIDAD PROFESIONAL

INTERDISCIPLINARIA DE BIOTECNOLOGIA

REPORTE FINAL

Control de bioprocesos descritos por ecuaciones diferenciales parciales

utilizando redes neuronales y modos deslizantes

01/01/2009

Contenido

1.  RESUMEN .............................................................................................................................. 2 

2.  GENERALIDADES ................................................................................................................... 3 

2.1.  Introducción ..................................................................................................................... 3 

2.2.  Modelado Matemático de Bioprocesos ............................................................................... 4 

2.3.  Ecuaciones Diferenciales Parciales en el Modelado de Sistemas .......................................... 5 

2.4.  Algoritmos Numéricos de Solución de Ecuaciones Diferenciales Parciales ............................ 5 

Método de Separación de Variables ........................................................................................... 5 

Método de diferencias finitas ..................................................................................................... 6 

2.6  Ejemplos Prácticos del Modelado por Ecuaciones Diferenciales Parciales de Bioprocesos ..... 8 

El sistema de digestión anaerobia .............................................................................................. 8 

3.  OBJETIVOS ............................................................................................................................ 8 

3.1.  Generales ........................................................................................................................ 8 

3.2.  Particulares ..................................................................................................................... 8 

4.  METODOLOGÍA ...................................................................................................................... 9 

4.1.  Meta 1. Diseño de un modelo en redes neuronales para la solución de ecuaciones diferenciales parciales .................................................................................................................. 9 

Espacio de Sobolev .................................................................................................................. 9 

Clases de sistemas descritos en parámetros distribuidos ............................................................. 9 

Definición del algoritmo de solución por redes neuronales diferenciales de sistemas definidos en parámetros distribuidos ........................................................................................................... 10 

Identificación de Estados basada en el Método de Separación de Variables para Ecuaciones Diferenciales Parciales: información incompleta ........................................................................ 12 

4.2.  Meta 2. Desarrollo del identificador de estado basado en redes neuronales diferenciales. .... 13 

4.3.  Meta 3. Desarrollo del controlador adaptable basado en modos deslizantes ........................ 14 

4.4.  Meta 4. Desarrollo del software que implemente los algoritmos de reconstrucción numérica. 17 

5.  RESULTADOS ....................................................................................................................... 18 

5.1.  Modelo matemático de la reacción de ozono con compuestos orgánicos ............................. 18 

5.3.  Aplicación del algoritmo de diferencias finitas en el proceso de ozonación ........................... 20 

CONCLUSIONES ........................................................................................................................... 21 

 

 

1. RESUMEN

La mayoría de los algoritmos de control de bioprocesos se ha fundamentado en descripciones matemáticas del sistema bajo estudio que emplean ecuaciones diferenciales ordinarias. Sin embargo, estos métodos de análisis pueden no ser tan eficientes al momento de tratar de describir las dinámicas internas de los reactores donde se llevan a cabo las interacciones entre los compuestos que conforman el bioproceso. Existe una visión novedosa en el desarrollo de esquemas de control moderno que han intentado utilizar los fundamentos de espacios de Banach para describir los problemas de regulación y seguimiento de trayectorias para modelos de sistemas descritos en parámetros distribuidos.

Sin embargo, el desarrollo de las técnicas mencionadas demandan el uso de un modelo matemático basado en ecuaciones diferenciales parciales, el cual es normalmente muy complicado de obtener por leyes básicas de modelaje matemático. En este punto, las redes neuronales aparecen como una herramienta interesante para obtener una reproducción numérica del modelo del bioproceso sin la necesidad de dedicar un gran esfuerzo en la parte de la obtención de la descripción matemática del modelo. Una vez que el modelo numérico basado en redes neuronales diferenciales ha sido obtenido, se puede utilizar algoritmos de control robusto como los modos deslizantes para lograr dirigir la dinámica del bio-proceso a la producción de alguna sustancia orgánica de interés o bien a la degradación de algún compuesto que pueda resultar potencialmente tóxico o contaminante.

Actualmente, muchos métodos numéricos han sido desarrollados para construir soluciones aproximadas de las descripciones matemáticas de sistemas no lineales basados en EDP. Entre otras, la técnica del elemento finito, el método de colocaciones ortogonales para ecuaciones en diferencias y el método de líneas son los algoritmos más populares para obtener las mencionadas soluciones numéricas.

La mayoría de las estructuras matemáticas que describen algún proceso, se representan en ecuaciones diferenciales ordinarias (ODE's), pues se asume que tales algoritmos dependen exclusivamente del tiempo. Esta suposición ha generado resultados satisfactorios en un gran número de aplicaciones, sin embargo, también ha producido herramientas matemáticas y algoritmos de control muy restrictivos, que no son capaces de producir con exactitud la descripción real y completa de las interacciones entre todos los componentes que participan en el sistema. En este contexto, las ecuaciones en derivadas parciales (EDP) aparecen como uno de los elementos a utilizar en la modelización matemática, ya que son una solución plausible para resolver los inconvenientes del modelado con ODE's. Las EDP son una descripción formal de sistemas no lineales, que presentan una representación más cercana al ente tratado, pero que sacrifican la utilización de métodos convencionales de resolución analítica de dichas ecuaciones, en favor de la fiabilidad del modelo.

Una vez que se dispone de un modelo matemático que describe de forma aproximada la realidad y después de analizar el modelo y deducir propiedades cualitativas de la solución que nos ayudan a comprender esta realidad, y tras desarrollar métodos numéricos para resolver el problema matemático y así poder describir cuantitativamente las propiedades del sistema o su evolución futura, surge de forma natural la cuestión de cambiar esta realidad buscando una situación más propicia para nuestros intereses. Aparece entonces la Teoría de Control de sistemas descritos por ecuaciones diferenciales o en derivadas parciales. El análisis de estos problemas ha puesto en evidencia la importancia de ciertos parámetros que aparecen en las ecuaciones y su influencia sobre la evolución del sistema. Es posible entonces actuar sobre estos parámetros para optimizar la eficiencia del sistema o conducirlo a un estado deseado.

Las Redes Neuronales (RN) se han convertido en una atractiva herramienta para la elaboración de modelos complejos de sistemas no lineales, debido a su inherente capacidad a la aproximación de funciones continuas. Las RN son herramientas poderosas para el manejo de problemas de gran escala. Sin embargo, su aplicación adolece por la falta de eficiencia en enfoques constructivos, tanto para la elección de una estructura de red como para la determinación de los parámetros de la neurona.

Aprovechando el hecho de que son aproximadores universales, las redes pueden sustituir directamente la parte desconocida del sistema (incertidumbres), definiéndolas por un determinado modelo matemático (continuos, discretos, etc.). Las RN contienen una serie de parámetros desconocidos ("pesos") que deben ser ajustados, para garantizar la convergencia de la red.

El enfoque de Redes Neuronales Diferenciales, aprovecha la información de las propiedades aplicada a la RND, permite evitar los problemas relacionados con la búsqueda externa de la conversión del proceso de aprendizaje para un diseño adecuado de la información. Si el modelo matemático de un proceso se considera incompleto o parcialmente conocido, la RND ofrece una aproximación eficaz para atacar un amplio espectro de problemas tales como la identificación, la estimación de estado, el seguimiento de las trayectorias, etc.

Al respecto, enfocaremos el problema de identificación a encontrar una expresión con base a las propiedades de las redes, que resuelva un sistema en ecuaciones diferenciales parciales.

2. GENERALIDADES

2.1. Introducción El desarrollo de modelos matemáticos que describen sistemas reales ha tenido una evolución de varios siglos. En realidad, se tienen reportes de descripciones matemáticas con conceptos dinámicos desde la primera mitad del siglo XII. Dichas representaciones fueron útiles para describir algunos fenómenos de la naturaleza pero carecieron en un principio de un estudio formal desde el punto de vista de ente matemático.

A principios del siglo XX, con el desarrollo de sistemas más complejos y que trabajaban durante más tiempo al día, se requirió del uso de técnicas de automatización y control que permitieran el incremento en la eficiencia de producción de muchos los sistemas bajo estudio.

Las necesidades científicas creadas por las demandas industriales llevo a un grupo numeroso de investigadores a desarrollar lo que hoy en día se conoce como teoría de control. Esta rama de la ciencia dirigió sus principales esfuerzos en el análisis de estructuras matemáticas que iban

desde las funciones simples hasta los modelos matemáticos de plantas industriales cuya descripción se encuentra dada en términos de ecuaciones diferenciales parciales.

A medida que la teoría de control se formalizó, un porcentaje muy alto de las investigaciones en el desarrollo de algoritmo de automatización se dirigió a la clase de modelos matemáticos basados en ecuaciones diferencial ordinarias, las cuales tienen como premisa principal el suponer que todo un sistema real puede comportarse como un solo punto en el espacio. Lo anterior implica que el modelo a analizar solo presenta evolución temporal, es decir las condiciones espaciales no son consideradas en las etapas de estudio.

Los requerimientos en el conocimiento más detallado de una gran cantidad de sistemas de interés industrial o tecnológico (como en el caso de reacciones químicas, procesos biológicos involucrando la actividad microbiana, comportamiento de reactores nucleares, etc.), promovió la utilización de descripciones más complejas en el modelado matemático de dicha clase de plantas. Para cumplir con estos requerimientos, fue necesario utilizar fundamentos matemáticos más complejos basados principalmente en el uso de ecuaciones diferenciales parciales. Sin embargo, el tratamiento de los modelos descritos en esta forma requiere de un conjunto de herramientas matemáticas mucho más complejas como el uso de la teoría de análisis funcional, teoría de espacios de dimensión infinita de tipo Hilbert y Banach, etc.

Fundamentalmente, el proceso de modelado incluso en ecuaciones diferenciales parciales es solo una aproximación de los sistemas reales, lo que implica que existe un alto grado de incertidumbre en la descripción de las plantas reales. De aquí que los métodos de identificación, estimación de estados y control adaptables toman gran importancia debido a que considerando la pobre exactitud que se gana en el proceso de modelado, se deben buscar modos alternativos para resolver el problema de modelado no paramétrico, estimación de estados en espacios de dimensión infinita y control de procesos descritos en ecuaciones diferenciales parciales.

Por la misma razón, la aplicación de técnicas de aproximación numérica basadas en redes neuronales, lógica difusa, funciones wavelets, etc. se convierten en una alternativa para la solución de los problemas antes mencionados. En particular, este manuscrito trata sobre el problema del modelado no paramétrico y el control de sistemas no lineales inciertos descritos en ecuaciones diferenciales parciales afectados por perturbaciones externas mediante el uso de redes neuronales diferenciales que en particular describen el comportamiento de procesos biológicos y/o químicos.

2.2. Modelado Matemático de Bioprocesos Los procesos llevados a cabo con microorganismos han llegado a ser una fuente importante de numerosos productos comerciales, principalmente en la industria farmacéutica y alimentaria, pero también en otras industrias, tales como la cosmética, el análisis clínico y químico, en la biorremediación con fines ambientales, etc.

Desde que hace varias décadas se empezaron a producir antibióticos, el cambio de escala de los procesos desarrollados en laboratorio ha sido considerado un problema de gran complejidad, donde la metodología empleada en los procesos químicos puede ser aplicada. Los modelos fenomenológicos, basados en fenómenos de transpone acoplados a las reacciones químicas, pueden ser desarrollados y aplicados para el diseño del biorreactor. La dificultad que se plantea en el estudio de este tipo de sistemas se debe a su naturaleza: son sistemas trifásicos gas-líquido-sólido. La peculiaridad de estos sistemas radica en que en la fase sólida se realizan las transformaciones que llevan tanto al desarrollo del propio sólido o cultivo microbiano (crecimiento) como a la síntesis de los productos de interés. Dichas transformaciones necesitan la presencia de gran cantidad de nutrientes que se encuentran principalmente en la fase líquida, siendo de especial importancia la entrada del oxígeno en sistemas aerobios y su ausencia en sistemas anaerobios.

Uno de los problemas que opera principalmente en el desarrollo de los bioprocesos y su modelado es el proceso de escalamiento. En el cambio de escala de este tipo de procesos, la importancia relativa de los diferentes fenómenos involucrados va cambiando. Así, se deben considerar varios fenómenos que hay que estudiar de forma aislada para, una vez que el conocimiento de los mismos es suficiente, ser acoplados con vistas a la descripción del proceso global. Durante el proceso de cambio de escala lo que va variando es la velocidad relativa de los diferentes fenómenos y, quizás, la etapa controlante de la velocidad global del proceso. Debido a la complejidad de estos sistemas microbianos, el cambio de escala no se realiza en un solo paso desde la escala de laboratorio a la escala de producción. En el laboratorio generalmente se opera en condiciones de escala reducida, donde se buscan nuevos productos, mecanismos de control, medios de producción y se mejoran las cepas. Después se pasa a un biorreactor de mayor volumen, donde el contacto gas-líquido es muy distinto de la etapa anterior, finalmente a un tamaño mayor. A esta escala, que de forma general se llama Planta Piloto, se estudian o se comprueban los efectos de diferentes variables, tales como la velocidad de agitación, el caudal de aire, la temperatura, el control del pH, etc., buscándose la simplificación de los problemas. En la primera etapa, a escala de laboratorio, también se aborda el estudio de los diferentes fenómenos y variables de forma aislada, para facilitar tanto el estudio como la comprensión. Cuando todos estos fenómenos sean suficientemente conocidos deben ser acoplados, y el conjunto debe describir el proceso global. Así, se puede proceder al diseño del biorreactor donde llevar a cabo la producción, para lo que se deben conjugar todos los factores de modo que la productividad sea la máxima alcanzable. Por tanto, es necesario realizar un cambio de escala teniendo en cuenta que el comportamiento del microorganismo, en cada nivel de producción, puede no ser el mismo; las diferencias pueden ser debidas a que las cantidades de energía y materia involucradas son distintas para producir la transformación. La complejidad de los sistemas que usan microorganismos lleva, en la práctica, a utilizar varias etapas de comprobación en el cambio de escala, y no solo una -de planta piloto- como ya es habitual en la Industria Química y Biotecnológica.

Entre los fenómenos básicos a tener en cuenta en el caso de transformaciones microbianas son destacables la transferencia de materia entre las fases del sistema, la descripción de la compleja red de reacciones que tiene lugar en el interior de las células y el posible daño o “stress” que sufren las células debido a las condiciones hidrodinámicas necesarias en el sistema para que el primero de los fenómenos comentados no sea la etapa limitante del proceso.

Por las razones expuestas hasta este punto, la descripción de los modelos del bioproceso puede estar dada en forma de parámetros concentrados o distribuidos. Las características de estos tipos de modelos se describen brevemente a continuación.

Los modelos con parámetros concentrados se describen con ecuaciones diferenciales ordinarias (EDO). En general: , , (2-1)

En particular, un sistema lineal: (2-2)

Por otro lado, los modelos con parámetros distribuidos se describen con ecuaciones diferenciales parciales (EDP). Por ejemplo la ecuación de difusión:

(2-3)

2.3. Ecuaciones Diferenciales Parciales en el Modelado de Sistemas Una vez que se dispone de un modelo matemático que describe de forma aproximada la realidad y después de analizar el modelo y deducir propiedades cualitativas de la solución que nos ayudan a comprender esta realidad, y tras desarrollar métodos numéricos para resolver el problema matemático y así poder describir cuantitativamente las propiedades del sistema o su evolución futura, surge de forma natural la cuestión de cambiar esta realidad buscando una situación más propicia para nuestros intereses. Aparece entonces la Teoría de Control de sistemas descritos por ecuaciones diferenciales o en derivadas parciales. El análisis de estos problemas ha puesto en evidencia la importancia de ciertos parámetros que aparecen en las ecuaciones y su influencia sobre la evolución del sistema. Es posible entonces actuar sobre estos parámetros para optimizar la eficiencia del sistema o conducirlo a un estado deseado.

Actualmente, muchos métodos numéricos han sido desarrollados para construir soluciones aproximadas de las descripciones matemáticas de sistemas no lineales basados en EDP. Entre otras, la técnica del elemento finito, el método de colocaciones ortogonales para ecuaciones en diferencias y el método de líneas son los algoritmos más populares para obtener las mencionadas soluciones numéricas.

2.4. Algoritmos Numéricos de Solución de Ecuaciones Diferenciales Parciales La modelación y el análisis matemático han contribuido a la comprensión de procesos, cada día más complejos, en las diferentes áreas del conocimiento a lo largo de la historia. Con el advenimiento de la computadora, durante la segunda mitad del Siglo XX, ha sido posible extender el análisis de los modelos a la solución y simulación numérica de los mismos. El desarrollo de métodos numéricos eficientes y robustos, ha permitido desarrollos científicos y tecnológicos con mayor calidad y menor costo. Por citar un ejemplo, un edificio puede construirse de manera virtual y ser evaluado estructuralmente antes de colocar la primera piedra. El fundamento de un laboratorio virtual, es la aplicación de los métodos numéricos a los modelos obtenidos de las ciencias físicas. Una herramienta básica en la modelación es la Mecánica del Medio Continuo. Su aplicación da lugar a modelos en ecuaciones diferenciales parciales (EDP) que describen el comportamiento y/o evolución de los diferentes medios, un sólido en el caso de ingeniería estructural.

Los tres métodos analíticos más conocidos y nombrados históricamente de solución de ecuaciones diferenciales parciales son: 1. Separación de Variables o Método de Fourier o solución por expansión de funciones propias. 2. Función de Green o Singularidades Fundamentales o solución por ecuaciones integrales. 3. Formulación Variacional o Método de Energía o solución por cálculo de variaciones. De estos tres métodos, el más utilizado por su sencillez, eficacia y porque lleva de la ecuación diferencial parcial a un conjunto de ecuaciones diferenciables ordinarias (ODEs), es el de Separación de Variables, del cual hacemos mención a continuación.

Método de Separación de Variables Dada una ecuación diferencial parcial (EDP) de una función de variables, es útil advertir la solución de la forma:

)()...()( 2211 nn xFxFxFF o )(...)()( 2211 nn xfxfxfF que lleva a la EDP a un conjunto de ODEs.

Usualmente cada variable independiente crea una constante de separación que no puede ser determinada sólo de la ecuación. Cuando funciona bien esta técnica llamamos a la ecuación, ecuación parcial diferencial separable.

Lo que esperamos para una solución )()(),( twxvtxu o )()(),( twxvtxu con las variables separables y

sustituyendo en la EDP tal que 0)()()(

)(2

2

2

2

twx

xv

x

xwxv . Así esperamos que la solución , nunca es cero (esto es,

a veces) y dividiendo por esta misma, se llega a

)(

)(

)(

)( xv

xv

tw

tw (2-4)

Como una función de t al igual que una función de x debe ser constante para )()(),( twxvtxu lo mismo que para

).()(),( twxvtxu Cuando el plano geométrico es diferente (esférico o rectangular) encontramos la expansión de Fourier más

natural en términos de funciones propias más que en senos y cosenos. Si por otro lado el dominio no está acotado, las funciones propias corresponden a valores propios. Las soluciones de las EDP pueden calcularse mediante métodos analíticos o aproximarse mediante métodos numéricos. Es nuestro propósito en esta sección, ilustrar el método numérico de diferencias finitas para el cálculo de la solución de la EDP para el caso unidimensional. En las EDP, nos enfrentamos a tres problemas:

1) Problema del valor en la frontera (BVP, por sus siglas en inglés) 2) Problema de valor inicial (IVP, por sus siglas en inglés) 3) Problema de valor propio (EVP, por sus siglas en inglés) Los primeros dos problemas, en los que nos enfocaremos por satisfacer los problemas de identificación y control adaptables, pueden resolverse por medio del método analítico de separación de variables. Sin embargo, éste método no es factible para resolver EDP's de tipo no lineales o lineales en un ordenador. Es así como justificamos el uso de Métodos Numéricos en la solución de EDP. Los métodos de aproximación analítica a la solución de EDP, proporcionan frecuentemente información útil acerca del comportamiento de la solución en valores críticos de la variable dependiente, pero tienden a ser más difíciles de aplicar que los métodos numéricos. Entre las consideraciones que justifican el uso de métodos numéricos para solucionar ciertos tipos de ecuaciones diferenciales ordinarias y en derivadas parciales se encuentran: Los datos de los problemas reales presentan siempre errores de medición, y el trabajo aritmético para la solución está limitado a un número

finito de cifras significativas que resultan en errores de redondeo. Por lo tanto, incluso los métodos analíticos proporcionan resultados que son aproximaciones numéricas.

La evaluación numérica de las soluciones analíticas es a menudo una tarea laboriosa y computacionalmente ineficiente, mientras que los métodos numéricos generalmente proporcionan soluciones numéricas adecuadas, de manera más simple y eficiente.

Método de diferencias finitas De los métodos de aproximación numérica disponibles para resolver ecuaciones diferenciales, los más utilizados son el método de diferencias finitas, el método de elementos finitos y el método de colocación orotogonal. En esta sección abordaremos solo el método de diferencias finitas que será empleado en la solución del proceso de identificación no paramétrica y control adaptables en ecuaciones diferenciales parciales. El Método consiste en una aproximación de derivadas parciales por expresiones algebraicas envolviendo los valores de la variable dependiente en un limitado número de puntos seleccionados. Como resultado de la aproximación, la ecuación diferencial parcial que describe el problema es reemplazada por un número finito de ecuaciones algebraicas, escritas en términos de los valores de la variable dependiente en puntos seleccionados. Las ecuaciones son lineales si las ecuaciones diferenciales parciales son también lineales. El valor de los puntos seleccionados se convierte en la incógnita, en vez de la distribución espacial continua de la variable dependiente. El sistema de ecuaciones algebraicas debe ser resuelto y puede envolver un número largo de operaciones aritméticas. Existen dos métodos para llevar a cabo el método planteado: Una es hacia delante y otro es hacia atrás, comúnmente nombrados progresivo y regresivo.

Método de Diferencias Finitas Progresivo Si se tiene una ecuación diferencial parcial de la forma

uxx

ft

u,,

2

2

(2-5)

de la cual su estructura es desconocida, pero es claro que depende de xxu , xu y u , puede ser reescrita como en (2)

Fux

uE

x

uD

t

u

2

2

(2-6)

La solución de esta última ecuación, puede calcularse mediante métodos analíticos o aproximarse mediante métodos numéricos. A continuación, se presenta el método numérico de diferencias finitas progresivo para el cálculo de (2).

La ecuación (2) es una ecuación diferencial parcial de orden 2, lineal y de coeficientes constantes ( FED ,, R ). Para obtener una

solución única de esta ecuación es preciso añadir también unas condiciones iníciales y de frontera apropiadas:

LTtLu

Utu

xfxu

),(

),0(

)()0,(

0 (2-7)

Si u es una función de x con derivadas finitas y continuas (1Cu ), entonces por el Teorema de Taylor se tiene que:

)()()()()(

)()()()()(3

612

21

3612

21

xuhxuhxUhxuhxu

xuhxuhxUhxuhxu (2-8)

Al sumar estas expansiones se obtiene:

)()()(2)()( 42 hoxuhxuhxuhxu (2-9)

Donde )( 4ho denota los términos que contienen potencias de h de orden 4 o mayor. Asumiendo que estos términos son pequeños en

relación con las potencias menores de h , se sigue que:

)()(2)(1

)(2

hxuxuhxuh

xu (2-10)

con un error de orden 2h . Al restar (3.2) de (3.1) y despreciar los términos de orden 3 se obtiene:

)()(2

1)( hxuhxu

hxu (2-11)

con un error de orden 2. Esta es una aproximación de la pendiente de la tangente en el punto ))(,( xux obtenida mediante la pendiente de

la recta que pasa por los puntos ))(,( hxuhx y ))(,( hxuhx . Esta aproximación se conoce como aproximación por

diferencia central. También se puede aproximar la pendiente de la tangente en ))(,( xux por la pendiente de la recta que pasa por los

puntos ))(,( xux y ))(,( hxuhx , obteniendo la aproximación por diferencias progresivas

)()(1

)( xuhxuh

xu (2-12)

Ahora, tomando una función de las variables x y t . Subdividiendo el plano tx en un conjunto de rectángulos iguales de lados

hx y kt mediante líneas equidistantes y paralelas al eje t , definidas por ihxi , ....2,1,0 i

Denotando el valor de en un punto ),( jkihP de la malla como:

(2-13)

Entonces por (3.4)

2

,2

2

2

2 ,,2,

h

jkhhiujkihujkhhiu

dx

u

dx

u

jiP

(2-14)

Que equivale a

2

,1,,1

,

2

2 2

h

uuu

dx

u jijiji

ji

(2-15)

De manera similar

k

uu

t

u jiji

ji

,1,

,

(2-16)

Método de Diferencias Finitas Regresivo Sea nuevamente la ecuación diferencial parcial de la forma (2-7), de la cual se asume nuevamente que su estructura es desconocida, pero es

claro que depende de xxu , xu y u , puede ser reescrita como en (2-10).

A continuación, se presenta el método numérico de diferencias finitas regresivo para el cálculo de (2). La ecuación (2) es una ecuación diferencial

parcial de orden 2, lineal y de coeficientes constantes ( FED ,, R ). Para obtener una solución única de esta ecuación es preciso añadir

también las condiciones iníciales y de frontera ya definidas.

Si u es una función de x con derivadas finitas y continuas (1Cu ), entonces por el mismo Teorema de Taylor se tiene la distribución

dada en (2-14). Utilizando ahora la siguiente aproximación numérica:

)2()(2)(1

)(2

hxuhxuxuh

xu (2-17)

con un error de orden h . Esta es una aproximación de la pendiente de la tangente en el punto ))(,( xux obtenida mediante la pendiente

de la recta que pasa por los puntos ))(,( xux y ))2(,2( hxuhx . Esta aproximación se conoce como aproximación por

diferencia central. También se puede aproximar la pendiente de la tangente en ))(,( xux por la pendiente de la recta que pasa por los

puntos ))(,( xux y ))(,( hxuhx , obteniendo la aproximación por diferencias progresivas

)()(1

)( hxuxuh

xu (2-18)

Ahora, tomando una función de las variables x y t . Entonces

2

,2,1,

,2

2 2

h

uuu

dx

u jijiji

ji

(2-19)

De manera similar

uP uih,jk ui,j

h

uu

t

u jiji

ji

,1,

,

(2-20)

2.6 Ejemplos Prácticos del Modelado por Ecuaciones Diferenciales Parciales de Bioprocesos Los siguientes ejemplos demuestran el uso de ecuaciones diferenciales parciales para modelar bioprocesos:

El sistema de digestión anaerobia Considérese un sistema de degradación anaerobia realizado en un reactor de cama fija y un tanque de recirculación. El comportamiento dinámico de las variables de estado más importantes en este proceso está descrito por las siguientes ecuaciones

1X X

(2-21)

Con

,

, (2-22)

Por otro lado, la dinámica de las especies en el tanque de recirculación está descrita por:

,T QT

VT1, t ,T

,T QT

VT1, t ,T

(2-23)

En estas ecuaciones: · 0,1 , es el tiempo de evolución del proceso de digestión, es el coeficiente de dispersión axial, es el factor de dilución, es la longitud del reactor de cama fija, es la concentración de las bacterias acido-génicas, es la concentración de las bacterias metano-génicas, es la demanda química de oxígeno (DQO), es la

concentración de los ácidos grasos volátiles (AGV) y es la fracción de bacterias en la fase líquida.

3. OBJETIVOS En esta sección se describen a detalle los objetivos tanto generales como particulares de este proyecto.

3.1. Generales Desarrollar un algoritmo de identificación de estados para bioprocesos descritos por modelos matemáticos con parámetros

distribuidos utilizando redes neuronales diferenciales y modos deslizantes Desarrollar un algoritmo de control para bioprocesos descritos por modelos matemáticos con parámetros distribuidos utilizando redes

neuronales diferenciales y modos deslizantes Realizar numéricamente los algoritmos de control e identificación desarrollados para su aplicación a modelos de bioprocesos.

3.2. Particulares Desarrollar un algoritmo de identificación de estados de un modelo descrito con parámetros distribuidos. Proponer una estructura de identificador basado en redes neuronales diferenciales y algoritmos de diferencias finitas. Proponer una función de Lyapunov para desarrollar el algoritmo de identificación por redes neuronales diferenciales Desarrollar un algoritmo numérico para la solución de ecuaciones diferenciales parciales por el método de diferencias finitas. Desarrollar un algoritmo numérico para la implementación de redes neuronales diferenciales incrustadas en el esquema del método

de diferencias finitas. Proponer una estructura de controlador basado en redes neuronales diferenciales y algoritmos de diferencias finitas. Desarrollar un algoritmo numérico para la implementación de redes neuronales diferenciales incrustadas en el esquema de control

basado en el método de diferencias finitas. Proponer una función de Lyapunov para desarrollar el algoritmo de control por redes neuronales diferenciales

4. METODOLOGÍA

4.1. Meta 1. Diseño de un modelo en redes neuronales para la solución de ecuaciones diferenciales parciales Antes de desarrollar el diseño de un modelo en redes neuronales diferenciales, es necesario considerar el concepto de Espacio de Sobolev que será ampliamente utilizado en el resto de este reporte.

Espacio de Sobolev Es un espacio vectorial de funciones equipadas con una norma que es combinación de normas Lp de la propia función, así como sus derivadas, hasta un orden determinado. Las derivadas se entienden en un sentido débil para hacer el espacio completo, el de Banach. Es así que un espacio de Sobolev es un espacio Banach o un espacio Hilbert de funciones con suficientes derivadas para algunas aplicaciones de dominio, EDP, y equipado con una norma que mide tanto el tamaño como la suavidad de una función. Su importancia radica en el hecho de que las soluciones de ecuaciones diferenciales parciales están naturalmente en espacios de Sobolev más que en espacios clásicos de funciones continuas y con las derivadas entendidas en el sentido clásico. Hay muchos criterios para la continuidad de funciones matemáticas. El criterio más básico de continuidad es el relacionado con la diferenciabilidad (porque las funciones que son diferenciables son también continuas) y aún una mayor noción de continuidad es que si la función

es diferenciable, también será continua (estas funciones se dice, son de la clase 1C ). Las funciones diferenciables son importantes en muchas

esferas, y en particular para las ecuaciones diferenciales. En el siglo XX, sin embargo, se observó que el espacio 1C (o

2C ,etc) no era

exactamente el espacio correcto para estudiar las soluciones de las ecuaciones diferenciales. Los espacios Sobolev son la sustitución moderna para estos espacios en los cuales se buscan soluciones de ecuaciones diferenciales parciales. Los espacios de Sobolev en la configuración más simple, el caso unidimensional dentro del circulo unitario, donde el espacio de Sobolev

pkW , se define como el subconjunto de

pL de tal manera que la función f y sus derivadas débiles hasta de orden k tienen una norma

finita pL , para 1p dada. Se debe tener cuidado al definir las derivadas en un sentido propio. En el caso unidimensional es suficiente

suponer que la )1( k -ésima derivada de la función f ,)1( kf , es diferenciable en casi todas partes y es igual en casi todas partes para

la integral de Lebesgue de sus derivadas. Con esta definición, el espacio de Sobolev admite una norma natural:

ppi

k

i

pp

p

ik

ipk

dttfff/1

)(

0

/1

)(

0,

)(

(4-1)

El espacio pkW ,

equipado con la norma es un espacio de Banach. Los espacios de Sobolev con 2p son especialmente importantes

por su conexión con las series de Fourier y porque ellos forman un espacio de Hilbert. Una notación especial para cubrir este caso es: 2,kk WH (4-2)

Además el espacio kH admite un producto interno, como el espacio

20 LH . De hecho, el producto interno kH se define en

términos del producto interno 2L :

2

,,L

ii

nH

vDuDvu k

2,kk WH (4-3)

El espacio kH se transforma en espacio de Hilbert con este producto interno.

Clases de sistemas descritos en parámetros distribuidos Con el fin de introducir el método propuesto en esta meta, se realizará un estudio del algoritmo de solución sobre un ejemplo específico. La metodología desarrollada en este apartado no pierde generalidad, ya que como se demostrará en la siguiente meta, este mismo esquema puede extenderse sin ningún esfuerzo a una clase de sistemas más general que el presentado a continuación. Sea el sistema no lineal de dimensión infinita (1) descrito en ecuaciones diferenciales parciales, que representa la dinámica de un reactor tubular

),(),(),(),(

2

2

txfx

txuE

x

txuD

t

txu

(4-4)

Donde ),( txu es la concentración del compuesto dentro del reactor en el instante de tiempo en la posición a lo largo del reactor. es el

coeficiente de difusión del gas y E es el coeficiente de desplazamiento longitudinal del gas y que depende de factores físicos en el sistema a

tratar como la presión de entrada del gas, el flujo, etc. La función ),( txf

es una función desconocida pero con propiedades delimitadas que

será utilizada para poder incluir un análisis de robustez ante la presencia de incertidumbres en la descripción del modelo. Las condiciones inicial y de la frontera del sistema bajo cuestión esta descrita a continuación:

0),0(,0)0,(,),0( 0 tuxuutu x (4-5)

Adicionalmente 1),(~ Ctxf , por ende, satisface la condición de Lipschitz, además 0~ fx . Además, supondremos que existe una

función de Lyapunov ),( txV tal que el sistema descrito en EDP es cuadráticamente estable. El análisis del algoritmo de solución de EDP por

redes neuronales estará basado en la técnica derivada del segundo método de Lyapunov.

Definición del algoritmo de solución por redes neuronales diferenciales de sistemas definidos en parámetros distribuidos Proponemos, basados en el método de separación de variables estudiando en el capitulo anterior que la solución del sistema está dada como en (2)

)()()()(),(1

xtWxtwtxu Tii

L

i

(4-6)

Donde el campo vectorial x t : n → k se asume contiene elementos monotónicamente crecientes

Tq (.)(.)...(.)(.) 21 . La representación típica de los elementos i son funciones sigmoidales con descripción

matemática dada como

ix ai1 e−b ixi−1 − ci (4-7)

Sin olvidar que también se pueden utilizar cualquiera de las introducidas en la sección de redes neuronales del capítulo anterior. El vector

)(tW T representa el vector de los pesos de la red neuronal, de forma tal que

xT

x

mxnn

TT WWW R,...,1

(4-8)

El análisis basado en el método de Lyapunov demostrará la robustez del identificador con respecto a la presencia de las incertidumbres

),(~ txf . Primero, se buscará una expresión de la dinámica que gobierna el error de identificación (3)

)())()(()()()()(

),(),(

xtWtWxtWxtW

txutxuTT

t

(4-9)

En este caso, )()(),( xtWtxu T es la mejor solución posible por una aproximación de redes neuronales diferenciales

utilizando la misma base que en el caso del identificador. En general, este es uno de los métodos más empleados para demostrar estabilidad de la red neuronal en el sentido de Lyapunov. Así el comportamiento dinámico del error está dado por:

fED

fED

fED

EDtxfED

uu

xx

xuu

xuu

xu

xu

xu

xu

xu

xu

xu

xu

t

tt ~

~

~),(~

2

2

2

2

2

2

2

2

2

2

2

2

(4-10)

Ahora, utilizando la regla de la cadena del cálculo diferenciales, se tiene

xtx

(4-11)

Intercambiando el orden de integración se tiene que

txxtx

(4-12)

El análisis de convergencia del proceso de identificación por redes neuronales diferenciales se lleva a través de la definición de una funcional de Lyapunov que permita transformar un análisis de estabilidad en una prueba del algoritmo de convergencia. En este caso, se tiene como funcional candidata de Lyapunov a (5):

2

1

2),(

PxT

Pt WKWtrtxV (4-13)

Siguiendo el segundo método de Lyapunov, se obtiene la derivada de la función definida anteriormente

xTx

Tt

Tt PWKWtrPV 22 2 1 (4-14)

Sustituyendo la expresión de t

en la ecuación anterior, se tiene:

x

f

xE

xDPWKWtr

fx

Ex

DPV

ttTx

T

ttTt

~22

~2

2

2

3

3

1

2

2

(4-15)

Para tratar con los términos obtenidos utilizaremos la desigualdad matricial descrita a continuación

XY YX ≤ XX Y−1Y

válida para cualquier X,Y ∈ Rs con una matriz definida positiva simétrica 0

∈ Rss. De lo anterior se

lleaga a la siguiente desigualdad. De aquí puede verse, que para continuar con el análisis de identificación, necesitamos que algunos términos tomen la forma de la ecuación de

Riccati ( 0 QPRPPAPA T) para poder eliminarlos. Entonces tenemos que para la ecuación anterior

114321

ffT WEDEDWR (4-16)

y

,14

123

132

112

Q

0QQQ (4-17)

a) Tratando únicamente con el término tTt QPRP buscamos que

0

0

P

QPRP (4-18)

Expresando lo anterior como una LMI. Así se tiene que ,0 PRPQ 01 R y ,0Q entonces:

01

QP

PR (4-19)

b) Tratando ahora sólo con WKWKEDPWtr xxTt

T11

22 podemos obtener la ley de aprendizaje

para el identificador

WKEDEDPK

W xxxxTt 1

232

1

1 (4-20)

De la desigualdad de Rayleigh-Ritz, reducimos el término tTt PPQPP

21

21

21

21

0 de forma tal que

)(max)(min 21

21

21

21

21

21

21

21

000

PQPPPQPPPQP tTt (4-21)

Y así vemos que

xffVV 1110~~ (4-22)

Donde .2)min( 21

21

0 PQP Integrando ahora ambos lados de la ecuación de 0 a T (T es el tiempo final) llegamos a (*)

xffVdt

dtxffVVVdtV

T

t

T

t

T

T

t

1110

0

1110

0

0

0

~~

~~

(4-23)

Arreglando los términos y por el Lema de Gronwall-Bellman

xffWKWtrxff

xffe

VxffVdtV

T

P

t

T

t

T

111011110

21110

01110

0

~~ ,~~

~~

~~

(4-24)

Identificación de Estados basada en el Método de Separación de Variables para Ecuaciones Diferenciales Parciales: información incompleta Sea el siguiente sistema, que representa la dinámica de la concentración de un solo compuesto en un reactor tubular.

),(~),(),(),(2

2

tufx

txuE

x

txuD

t

txu

(4-25)

Las variables involucradas en este modelo son las mismas que ya se introdujeron con anterioridad. Las condiciones inicial y de la frontera son similares a las presentadas en el caso anterior. Nuevamente el análisis se realizará basándonos en la técnica derivada del segundo método de

Lyapunov, por lo tanto diremos que existe una función de Lyapunov ),( txV tal que el sistema (1.3) es cuadráticamente estable.

Adicionalmente se busca que txV , evaluada en las trayectorias del sistema, cumpla con la condición de derivada

0),(~ si ),(),( 2

tufxwx

txV (4-26)

Proponemos, basados en el método de separación de variables estudiando en el capitulo anterior que la solución del sistema está dada como sigue

),(~)()()()(),( 11

txfxtWxtwtxu Tii

L

i

(4-27)

Donde el campo vectorial kn

tx RR:)( es similar al definido con anterioridad, al igual que )(tW T representa el vector de los

pesos de la red neuronal. La función ),(~1 txf representa el error de modelado dado por la cantidad finita de funciones de activación incluidos

en la descripción de la red neuronal. Con este análisis pretendemos demostrar la robustez del identificador con respecto a ),(~1 txf

satisfaciendo .),(~11 xLtxf .

Utilizando nuevamente la aproximación del gradiente de la derivada temporal del error de identificación definido por

xf

xE

xD

fx

Ex

Dxtx

tt

x

~

~

2

2

3

3

2

2

(4-28)

Definiendo ahora una función de Lyapunov que permita realizar el análisis de estabilidad, se tiene como V candidata a la siguiente función:

2

1

2),(

PxT

Pt WKWtrtxV (4-29)

Donde la matriz P es una matriz positiva defina. Siguiendo el segundo método de Lyapunov, se obtiene la derivada de la función anterior

xTx

Tt

Tt PWKWtrPV 22 2 1 (4-30)

Sustituyendo t

y x

se obtiene:

x

f

xE

xDP

WKWtrfx

Ex

DPV

ttTx

TttTt

~2

2~2

2

2

3

3

12

2

(4-31)

De aquí puede verse, que para continuar con el análisis de identificación, necesitamos que algunos términos tomen la forma de la ecuación de

Riccati ( 0 QPRPPAPA T). De la desigualdad de Rayleigh-Ritz, reducimos los términos

tTt PPQPP

21

21

21

21

0 y xTx PPQPP

21

21

21

21

1 de forma tal que

)(max)(min

)(max)(min

21

21

21

21

21

21

21

21

21

21

21

21

21

21

21

21

111

000

PQPPPQPPPQP

PQPPPQPPPQP

xTx

tTt

(4-32)

y así vemos que

xffVV 1110~~ (4-33)

donde ).min(2)min( 21

21

21

21

10

PQPPQP Integrando ahora ambos lados de la ecuación de 0 a T (T es

el tiempo final) llegamos a (*)

xffVdt

dtxffVVVdtV

T

t

T

t

T

T

t

1110

0

1110

0

0

0

~~

~~

(4-34)

Arreglando los términos y por el Lema de Gronwall-Bellman

xffe

VxffVdtV

t

T

t

T

1110

01110

0

~~

~~

(4-35)

4.2. Meta 2. Desarrollo del identificador de estado basado en redes neuronales diferenciales. En realidad, el problema de aproximar ecuaciones diferenciales parciales por un algoritmo numérico como las redes neuronales no es una tarea simple, dadas las diversas formas que pueden adoptar dichas estructuras. En general, el desarrollo presentado en este reporte trata de una clase de EDP de tipo lineal con coeficientes variantes en tiempo.

La identificación de sistemas es el proceso por el cual se determinan los parámetros de las ecuaciones que describen matemáticamente un proceso físico, de acuerdo con un determinado criterio. La identificación de sistemas no lineales puede ser enfocada como la aproximación del comportamiento del sistema. El proceso de identificación de un sistema comprende las siguientes tareas: Estudio experimental (Adquisición de datos) Formulación de un criterio Seleccionar la estructura del modelo Estimación de los parámetros Validación del modelo obtenido Si utilizamos una red neuronal para atacar un problema de identificación, la ley de aprendizaje asegura que el error de identificación converga a cero o a una zona acotada (con dinámicas no modeladas). Por medio de un análisis de tipo Lyapunov se determinan las condiciones de estabilidad para el error de identificación . Para el análisis de identificacion, tratado en esta sección, utilizamos una ecuación de Riccati. Establecemos los teoremas que dan las cotas para el error de identificación y del estado que son proporcionales a la cota desconocida. Identificación de Estados basada en Métodos Numéricos para Ecuaciones Diferenciales Parciales: Caso Escalar Sea la ecuación diferencial parcial con estructura desconocida

txutxutxuftxu xxxt ,,,,,, (4-36)

con condiciones a la frontera:

0),0(

0)0,(

),0( 0

tu

xu

utu

x

(4-37)

Siguiendo la metodología de las redes neuronales diferenciales, se asume que existen un conjunto de parámetros

3

2

1

,3

,2

,1

si

si

si

W

W

W

(4-38)

tales que

0~)()()( 2,

31,

2,

1

0

dfuuWuuWuWuAu i

ii

Tiii

Tii

Tii

it

i (4-39)

Donde las funciones

ui ∈ s1 , ui ∈ s2 , ui ∈ s3

(4-40)

Obedecen las siguientes condiciones de sector

22

22

22

~)~()(

~)~()(

~)~()(

iiii

iiii

iiii

vvLvv

vvLvv

vvLvv

(4-41)

y estan acotadas en U , es decir

222)( ,)( ,)( (4-42)

Los términos f̃ i , llamados errores de modelado de cada una de las redes neuronales utilizadas para la aproximación de la ecuación diferencial

parcial obedecen el siguiente grupo de desigualdades

ii

ii

ii

ii fufufuff 3

2

22

2

11

2

0

2~ (4-43)

y

iiii

ii

ii

iiiii FxtFuFuFuFxtAff 4

2

3

2

22

2

11

2

0

22,,~: (4-44)

Mientras que el gradiente del error de modelado esta acotado de la siguiente manera:

ii

ii

ii

iix fufufuff 7

2

26

2

15

2

4

2~ (4-45)

y se tiene

iix

ii

ii

ii

i

ix

iix

ix

FxtFuFuFuF

xtAff

8

2

7

2

26

2

15

2

4

22

,

,~:

(4-46)

Dado que se supone que se puede acceder a los valores de ,iu 1iu y 2iu en X , se pueden estudiar tres casos distintos de

aproximación numérica basada en identificadores adaptables como sigue: Caso 1.

Sea la siguiente estructura de identificador adaptable

2,31,2,1 )()()(ˆ ii

Titii

Titi

Titi

ii uuWuuWuWuAu

dt

d (4-47)

con iA y donde las matrices variantes en tiempo

321,3,2,1 , , sit

sit

sit WWW (4-48)

obedecen las siguientes ecuaciones diferenciales matriciales

tWKxtuuTxtu

uSxtuPxtK

tW

tWKxtuuTxtu

uSxtuPxtK

tW

dxtWKuTxtu

uSxtuPxtK

tW

iimi

iiT

i

ixiTi

xiiTiN

ix

i

iimi

iiT

i

ixiTi

xiiTiN

ix

i

iim

iiT

i

ixiTi

xiiTiN

ix

i

3321

1

033

2211

1

022

111

1

011

~,)(,

)(,)(,2

1

~,)(,

)(,)(,2

1

~

)(,

)(,)(,2

1

(4-49)

TEOREMA. Sea el sistema no lineal descrito en ecuaciones diferenciales parciales incierto y perturbado en el estado y la salida () con las condiciones a la frontera de tipo Dirichlet y Neumman definidas en (). Suponga además la estructura del identificador no paramétrico adaptable ()

cuyos parámetros se ajustan de acuerdo a la ley adaptable dada en (). Si existen matrices QPi

, QSi

y QTi

definidas positivas tales que

las ecuaciones de Riccati () tienen soluciones positivas definidas Pi , Si

y Ti ( i 3,N )

1,,ˆlim

xtuxtu iit

(4-50)

4.3. Meta 3. Desarrollo del controlador adaptable basado en modos deslizantes La síntesis de controladores no lineales basados en la información proporcionada por la señal de salida, representa uno de los mayores retos en el desarrollo de la teoría de sistemas y en el área de control automático. Este proceso de construcción de señales de control, es todavía más demandante cuando no existe certeza en la descripción matemática del modelo del sistema no lineal y cuando la dinámica del sistema está afectada por perturbaciones externas. El desarrollo de este estudio está dedicado a tratar la clase de problemas descrita previamente, pero considerando que incluso la señal de salida esta interferida por ruidos que puedan provenir del proceso de medición o bien por problemas de digitalización. Así, el concepto de Control Adaptable cuando no hay información completa de los estados del sistema no lineal, es analizado con detalle en esta meta, con el fin de introducir los principios básicos que definen el principal sustento teórico del controlador para sistemas inciertos no lineales basado en estados estimados por redes neuronales diferenciales.

Las estrategias de control que se mostrarán en esta sección del trabajo consisten en lograr el seguimiento de los estados originales del sistema sobre los de un modelo de referencia al cual se desee acceder el cual estará descrito por la ecuación diferencial. El mayor reto en el diseño de sistema de control, consiste en la síntesis de funciones que regulen un proceso dinámico, en el cual la información disponible sea limitada. En general, cuando se trata de controlar de un sistema real, es difícil asumir que se cuenta de primera mano con una representación matemática acertada de la evolución temporal de la planta en cuestión. Esto representa, por sí sólo, un reto interesante para los métodos actuales de control no lineal, dado que en gran medida, las soluciones descritas hasta hace unos veinte años, solo podían tratar problemas en donde el modelo matemático está bien descrito. La aparición del llamado control adaptable, no solo permitió el uso de algoritmos ajustables que permitirían lidiar con la incertidumbre del desconocimiento del modelo de la planta e incluso con perturbaciones externas que afecten la ecuación dinámica del sistema bajo estudio. Hasta hace algunos años, se propusieron algunos desarrollos bajo la consideración de que no todo el estado pudiera estar disponible para poder sintetizar las funciones de control, lo que implicaba un gran reto adicional, dado que bajo la necesidad de regular un sistema no lineal con información incompleta y afectado por perturbaciones externas, no hay un gran número de desarrollos en este campo particular de la teoría del control automático. El fundamento de la presente tesis se centra en desarrollar un método de control adaptable para sistemas no lineales con estructura desconocida, del cual solo se dispone de la señal de salida afectada por ruidos o de medición o bien por factores externos. El número de ejemplos en la literatura que han tratado de analizar esta clase de sistemas es muy reducido, sin embargo, la combinación de técnicas clásicas (control por colocación de polos, control óptimo), con sistemas de estructura variable (modos deslizantes) y algoritmos adaptables para sistemas inciertos (redes neuronales) parecería ser una forma de atacar el problema antes planteado. El reto de resolver no sólo el problema de estabilización, sino de seguimiento de trayectorias para el tipo de sistemas inciertos ya descrito, es más interesante, desde el punto de vista de los algoritmos que se deben usar y de las soluciones que se deben proponer. La búsqueda de la función de control que resuelva el problema de seguimiento no solo tiene una motivación matemática, la cual resulta en un desafío por demás interesante, sino que trata de acercar los casos reales, en donde no se conoce la estructura matemática del sistema y donde los efectos de perturbaciones externas se encuentran presentes en todo momento, a la matemática aplicada que sustenta la teoría de los sistemas dinámicos descritos en ecuaciones diferenciales parciales. Esto proviene, particularmente, de la necesidad de buscar la solución de problemas más generales que aquellos que suponen que el sistema analizado satisface estructuras regulares o bien canónicas, dado que fuera de los sistemas mecánicos, es realmente raro encontrar esta clase de comportamiento en sistemas biológicos, químicos o biotecnológicos, por mencionar sólo algunos. Las estrategias de control que se mostrarán en esta sección del trabajo consisten en lograr el seguimiento de los estados originales del sistema sobre los de un modelo de referencia al cual se desee acceder el cual estará descrito por la ecuación diferencial:

, , 0 (4-51) En otras palabras se desea sincronizar la dinámica original descrita en la ecuación (4-36) con la dinámica de referencia definida en (4-51). En el caso particular del problema de regulación se tiene:

0, 0 (4-52) Donde es una constante conocida. Sea la ecuación diferencial parcial con estructura desconocida

vtxutxutxuftxu xxxt ,,,,,,, (4-53)

Con condiciones a la frontera:

0),0(

0)0,(

),0( 0

tu

xu

utu

x

(4-54)

En este caso se asume que es posible medir el valor de txut , a lo largo de toda la coordenada espacial . La función se define

como una entrada exógena que tiene el sentido de control. Siguiendo la metodología de las redes neuronales diferenciales, se asume que existen un conjunto de parámetros

4

3

2

1

,4

,3

,2

,1

si

si

si

si

W

WW

W

(4-55)

Tales que

0~)()(

)()(

,42

,3

1,

2,

1

0

d

fvxWuxW

uxWxWuAu

ii

Tiii

Ti

ii

Tii

Tii

it

i (4-56)

Donde las funciones

4321 )(,)( ,)( ,)( si

si

si

si xxxx (4-57)

Obedecen las siguientes condiciones de sector

22

22

22

22

~)~()(

~)~()(

~)~()(

~)~()(

iiii

iiii

iiii

iiii

zzLzz

zzLzz

zzLzz

zzLzz

(4-58)

y están acotadas en U , es decir

2222)( ,)( ,)( ,)( (4-59)

Los términos if~ , llamados errores de modelado de cada una de las redes neuronales utilizadas para la aproximación de la ecuación diferencial

parcial obedecen el siguiente grupo de desigualdades

ii

ii

ii

ii fufufuff 3

2

22

2

11

2

0

2~ (4-60)

y

iiii

ii

ii

iiiii FxtFuFuFuFxtAff 4

2

3

2

22

2

11

2

0

22,,~: (4-61)

Mientras que el gradiente del error de modelado esta acotado de la siguiente manera:

ii

ii

ii

iix fufufuff 7

2

26

2

15

2

4

2~ (4-62)

y se tiene

iix

ii

ii

ii

i

ix

iix

ix

FxtFuFuFuF

xtAff

8

2

7

2

26

2

15

2

4

22

,

,~:

(4-63)

Dado que se supone que se puede acceder a los valores de ,iu 1iu y 2iu en X , se pueden estudiar tres casos distintos de

aproximación numérica basada en identificadores adaptables como sigue: Caso 1 del Diseño del Controlador Adaptable

Sea la siguiente estructura de identificador adaptable

ti

Titii

Tit

ii

Titi

Titi

ii

vxWuxW

uxWxWuAudt

d

)()(

)()(ˆ

,42,3

1,2,1

(4-64)

con iA y donde las matrices variantes en tiempo

4321,4,3,2,1 , , , sit

sit

sit

sit WWWW (4-65)

Obedecen las siguientes ecuaciones diferenciales matriciales

dxtWKxtuuTxtu

uSxtuPxtK

tW

dtWKxtuuTxtu

uSxtuPxtK

tW

dxtWKxtuuTxtu

uSxtuPxtK

tW

dxtWKuTxtu

uSxtuPxtK

tW

iimi

iiT

i

ixiTi

xiiTiN

ix

i

iimi

iiT

i

ixiTi

xiiTiN

ix

i

iimi

iiT

i

ixiTi

xiiTiN

ix

i

iim

iiT

i

ixiTi

xiiTiN

ix

i

4421

1

044

3321

1

033

2211

1

022

111

1

011

~,)(,

)(,)(,2

1

~,)(,

)(,)(,2

1

~,)(,

)(,)(,2

1

~

)(,

)(,)(,2

1

(4-66)

En base a lo anterior se puede formular el siguiente: TEOREMA. Sea el sistema no lineal descrito en ecuaciones diferenciales parciales incierto y perturbado en el estado y la salida con las condiciones a la frontera de tipo Dirichlet y Neumman definidas previamente. Suponga además la estructura del identificador no paramétrico adaptable considerado en este caso cuyos parámetros se ajustan de acuerdo a la ley adaptable dada en ¡Error! No se encuentra el origen de

la referencia.. Si existen matrices QPi

, QSi

y QTi

definidas positivas tales que las ecuaciones de Riccati tienen soluciones positivas

definidas Pi , Si

y Ti ( i 3,N )

4,,ˆlim

xtuxtu iit

(4-67)

TEOREMA. Sea el sistema no lineal descrito en ecuaciones diferenciales parciales incierto y perturbado en el estado y la salida definido antes con las condiciones a la frontera de tipo Dirichlet y Neumman definidas anteriormente. Suponga además la estructura del identificador no

paramétrico adaptable cuyos parámetros se ajustan de acuerdo a la ley adaptable dada en (4-73). Si existen matrices iPQ ,

iSQ y QT

i

definidas positivas tales que las ecuaciones de Riccati tienen soluciones positivas definidas Pi, Si

y Ti (i 3,N )

3,,ˆlim

xtuxtu iit

(4-68)

Redefiniendo la estructura del observador propuesto de la siguiente manera:

)(:

ˆ)(ˆ)()(ˆ:

ˆˆˆ

,41

2,31,2,10

10

i

Tit

ii

Titii

Titi

Titi

i

tiii

xWF

uxWuxWxWuAF

vuFuFudt

d

(4-69)

Definiendo el siguiente índice de desempeño, el cual determina la calidad de aproximación entre el sistema original y el sistema de referencia:

lim lim , (4-70)

Donde las matrices y provienen de la definición clásica de control óptimo, cumpliendo con las condiciones ya ampliamente conocidas. Aquí se tiene que

Redefiniendo el índice de desempeño de la siguiente manera

lim lim , (4-71)

Utilizando la siguiente desigualdad en el índice de desempeño dado previamente

1 1 (4-72) Entonces, se obtiene

lim lim 1 1 , (4-73)

En este caso, dado que el término ha sido tratado a través del proceso de identificación en sus tres casos, solo se discutirá la

minimización del término empleando la técnica de modos deslizantes como se describe a continuación.

Considerando la dinámica dada en la ecuación anterior y considerando que

, itii vuFuF ˆˆ 10 ,

,

, (4-74)

En la cual se puede despejar la función de control , llegando a:

itv iuF ˆ1

, iuF ˆ1

,

, iuF ˆ1 iuF ˆ0 (4-75)

4.4. Meta 4. Desarrollo del software que implemente los algoritmos de reconstrucción numérica. Una vez que se han presentado todos los preliminares teóricos sobre loa modelos de aproximación numérica basados en redes neuronales, que incumbe el desarrollo del algoritmo de identificación al igual que lo referente al campo del control a través de inteligencia artificial, y que se cuenta con un plan detallado de cómo resolver el problema planteado, se presentan ahora los logros alcanzados después de unir los resultados y enfocarlo en un sentido particular: la obtención de un controlador inteligente para sistemas descritos en ecuaciones diferenciales parciales.

Así, se describirá detalladamente cómo se realizó la construcción y pruebas del algoritmo de solución numérica así como el esquema de interacción para la solución dependiente del tiempo y de la posición a lo largo del reactor.

El sistema de software incluyo el diseño de un sistema de simulación en lenguaje m y en el sistema de soluciones numéricas conocido como Simulink. En el caso del identificador se diseño un algoritmo que recorre la solución de la EDP en el espacio, resolviendo las ecuaciones diferenciales ordinarias

La siguiente figura demuestra el algoritmo basado en lenguaje m.

clear all; close all; clc; n=10; xMax=50; x=xMax/0.01; v=zeros(n,x+1); g=zeros(n,x+1); save Data1 Data1; save G1 G1; for j=1:(x+1) Data2(1,j)=(j-1)*0.1; Data2(2,j)=rand(1,1); G2(1,j)=(j-1)*0.1; G2(2,j)=rand(1,1); end save Data2 Data2; save G2 G2; for i=3:n [t r y]=sim('idnnc2uc3'); size(r); size(y); v(i,:)=y(:,1); g(i,:)=y(:,2); y1=y(:,1); y2=y(:,2); Data2=Data1; Data1=[t'; y1']; G2=G1; G1=[t';y2']; save Data1 Data1; end size(v) tx = 0:1:n; ty = 0:0.01:xMax; ty=ty/100; [XI,YI] = meshgrid(tx,ty); figure (1) surf(ty,tx,v,'FaceColor','interp','EdgeColor','none','FaceLighting','phong'); colormap gray camlight right; set(gca,'FontSize',13) title('Dinamica de un Reactor Tubular'); xlabel('xt') ylabel('Tiempo') zlabel('C_A_,_t') set(gca,'Position',[0.07 0.15 0.80 0.79]); set(gca,'zlim',[0 20]) colorbar([0.95 0.1 0.01 0.8]) caxis([0 20]) view(22,17)

Figura 4.1 Modelo se software para resolver el problema de identificación por redes neuronales diferenciales

5. RESULTADOS Los resultados descritos en este documento están divididos en dos secciones, la primera que se encuentra dedicada al proceso de modelación del sistema de descomposición de contaminantes en presencia del ozono y la segunda dedicada al proceso de identificación y control de este sistema utilizando el algoritmo propuesto de modos deslizantes.

5.1. Modelo matemático de la reacción de ozono con compuestos orgánicos En esta sección, se ha derivado un modelo matemático para un reactor tubular químico. La hipótesis más sencilla en el estudio de la simulación de reactores químicos es suponer que la circulación del fluido por el reactor es uniforme; sin embargo, en los reactores reales normalmente se produce un alejamiento de estos comportamientos ideales, que puede ser debido a que no todas las moléculas que pasan por el reactor permanecen en él igual tiempo, es decir se difuminan a una velocidad especifica que depende de la posición, lo cual es considerado para este

modelo, en el que se ha conside también que se lleva a cabo una reacción química entre el Ozono ( ,3O utilizado en la eliminación del

contaminante) y el resto de los compuestos y otra entre cada uno de ellos con los otros, no se ha considerado cuando los reactivos y/o los productos forman aglomeraciones y no se mezclan entre sí, así como la existencia de "zonas muertas" en las que el fluido prácticamente no se renueva. La primera aproximación en la dinámica de un compuesto contaminante y el Ozono se presenta a continuación: 1) Un sólo contaminante sin interacción en la transferencia de masa

),(),(),(),(

),(

),(),(),(),(

),(

33

33

3

3

3

33

1,11

121

2

11

1,12

2

xtuxtukx

xtuv

x

xtuDxtu

xtuxtukx

xtuv

x

xtuDxtu

OO

OOO

OO

OO

(5-1)

Sea ,)],(),,([:),( 13

TO xtuxtuxtU por lo tanto el sistema anterior se puede escribir como:

)),((),(),(

),(3,12

2

xtUfkx

xtUv

x

xtUDxtU O

(5-2)

Donde

1

1:)(,:,

0

0:

3

33

111

OOO uuUfv

vv

D

DD .

En este modelo se describe el flujo real en el reactor como una desviación del modelo de flujo ideal. Esta desviación se cuantifica mediante un único parámetro que se denomina "Módulo de Dispersión", que describe, con bastante exactitud, la efusión en tuberías largas con flujo laminar, es decir, en aquellos casos que no se encuentran muy alejados del comportamiento uniforme; representando la constante de difusión de las

moléculas del Ozono con 3OD , mientras que la del compuesto contaminante presente por 1D . Esta dispersión se describe de forma similar a

la difusión incluida en la ley de Fick. La velocidad del contaminante está dada por x

xtu

),(1 multiplicado por un parámetro v 1 , de igual

forma para la velocidad del Ozono en el reactor tenemos .),(

3

3 x

xtuv

O

O

Finalmente, la interacción que existe entre el Ozono y el

contaminante que se pretende eliminar está dada por ),(),(33 1,1 xtuxtuk OO presente tanto en el análisis para el gas contaminante

como para el Ozono. La siguiente aproximación consiste en hacer uso de la información sobre un mayor número de compuestos presentes en el reactor y que también interaccionan con el Ozono y entre ellos: 1) Mezcla de compuestos sin interacción en la transferencia de masa

u̇O3t,x DO3

∂2u O3t,x

∂x2 vO3

∂uO3t,x

∂x − ∑j1

N

k j,O3ujt,xuO3t,x

u̇it,x Di∂2u it,x

∂x2 v i

∂u it,x∂x − k i,O3uit,xuO3t,x − ∑

j≠ij1

N

k i,juit,xujt,x,

(5-3)

Sea Ut,x : uO3t,x,u1t,x,u2t,x, . . . ,uNt,x, T, por lo tanto el sistema anterior se puede escribir como:

U̇t,x D∂2Ut,x∂x 2

v∂Ut,x∂x

− UTt,xKUt,x

(5-4)

.La DO3 representa la constante de difusión de las moléculas del Ozono, mientras que la de los compuestos presentes se representa por

Di. La velocidad de los compuestos está dada por ∂u it,x∂x multiplicado por un parámetro v i, de igual forma para la velocidad del

Ozono en el reactor tenemos vO3

∂uO3t,x

∂x .

Finalmente, la interacción que existe entre el Ozono y los otros compuestos está dada por ),(),(33,

1xtuxtuk OjOj

N

j mientras que en

el análisis para cada compuesto consideramos la interacción entre este y el ozono y este con los otros gases como

),(),(),(),( ,1

, 33xtuxtukxtuxtu jiji

N

jOiOi

ij .

5.2. Degradación de contaminantes usando ozono con formación de subproductos

El proceso de eliminación de contaminantes en fase gas por efecto de la aplicación de ozono se puede describir de la siguiente manera:

DC

DC

(5-5)

Donde · 0,1 , es el tiempo de evolución del proceso de ozonación, es el coeficiente de dispersión longitudinal del primer contaminante, es el factor de dilución, es la longitud del reactor de cama fija, es la concentración de ozono dentro del reactor tubular, es la concentración de algún contaminante químico y es la constante de velocidad de reacción entre el contaminante inicial y el ozono. El modelo anterior no considera la formación de subproductos de la reacción inicial entre el ozono el contaminante en cuestión. En consecuencia, las reacciones entre los diferentes productos formados no aparecen en el modelo matemático descrito. Una variación del modelo presentado en (5-5) incluye todos estos aspectos:

DC

DC

, i 2, n

(5-6)

El modelo anterior incluye la descripción del proceso de difusión del ozono con constante D , el proceso de difusión de cada uno de los subproductos D , el proceso de dilución del ozono descrito a través del coeficiente y en el caso de los subproductos a través de . Las dinámicas anteriores describen únicamente el proceso de transferencia de masa, mientras que los aspectos cinéticos están descritos por los términos ∑ que representan la reacción bimolecular entre el ozono y cada uno de los subproductos formados con la constante de reacción .

5.3. Aplicación del algoritmo de diferencias finitas en el proceso de ozonación En esta sección se describe la aplicación del método de diferencias finitas a los procesos de ozonación descritos en la sección 5.2. Dado que el modelo presentado en la ecuación (5-6) generaliza al resto de las representaciones matemáticas propuestas con anterioridad, solo se desarrollará con detalle esta expresión. Para resolver este problema, se deben retomar un par de resultados bien conocidos provenientes del método de diferencias finitas:

, , , (5-7)

Mientras que

,, , , , , ,

, 2 , ,

(5-8)

Una vez que se han considerado estos resultados, el modelo descrito en la ecuación (5-6) se puede escribir de acuerdo a:

∂CD

2

∂CD

2t

j 2, n

(5-9)

Utilizando el sistema de solución por software diseñado en este proyecto se pueden obtener las trayectorias del sistema de ozonación descrito previamente. La siguiente solución numérica fue diseñada considerando solo la presencia de un solo contaminante y utilizando constantes de reacción reportadas en literatura tal y como sigue:

0.002 , 0.005

0.0004 , 0.007

40

(5-10)

Los resultados de simulación para cada uno de los componentes involucrados en el modelo anterior obedecen el siguiente comportamiento

Figura 5.1

Figura 5.2

CONCLUSIONES El presente documento muestra un resumen de los resultados obtenidos en una nueva teoría referida a la aplicación de las redes neuronales diferenciales para resolver el problema de identificación no parametrica de sistemas descritos en ecuaciones diferenciales parciales. El problema de identificación fue resulto considerando tres casos distintos analizados a través de tres estructuras basadas en redes neuronales diferenciales, permitiendo calcular tres diferentes juegos de leyes de aprendizaje que requieren del uso de la solución de un juego de ecuaciones algebraicas de Riccati. En cada uno de los casos tratados, se desarrollo una prueba formal basada en teorías generales de control automático como el segundo método de Lyapunov. De la misma forma, el problema del diseño de controladores automáticos para sistemas descritos en ecuaciones diferenciales parciales fue resuelto satisfactoriamente, incluyendo el diseño de un identificador con sistema de control por retroalimentación y el diseño de un método de control basado en modos deslizantes. Las estructuras de control propuestas fueron diseñadas para obtener convergencia en tiempo finito del sistema incierto a una trayectoria de referencia diseñada en base a una trayectoria deseada del comportamiento de la red neuronal diferencial. La solución de los algoritmos de identificación y control se obtuvieron a partir de un par de algoritmos desarrollados para resolver las ecuaciones diferenciales parciales de ambos problemas. Ambos algoritmos fueron satisfactoriamente probados para dos clases de sistemas: uno relacionado con un sistema de eliminación de contaminantes en aire cuya reacción se llevo a cabo en un reactor tubular y un segundo relacionado con la eliminación de compuestos orgánicos en un reactor biológico anaerobio. Ambos casos fueron resueltos de manera aceptable, basándose en los resultados asociados al error de identificación y control.