programación lineal con espacios covariante y
TRANSCRIPT
INGENIERÍA Investigación y Tecnología IX. 3. 185-204, 2008(artículo arbitrado)
Programación lineal con espacios covariante ycontravariante. Una perspectiva física y matemática
Linear programming in covariant and contravariantmanifolds. A physical and mathematical perspective
J.L. Urrutia-Galicia 1 , J.C. Alcérreca-Huerta 2 y M.A. Ordaz-Alcántara 3
1 Instituto de Ingeniería, Mecánica Aplicada, Universidad Nacional Autónoma de México, 2 Facultad de Ingeniería, Universidad Nacional Autónoma de México y
3 Facultad de Ciencias, Universidad Nacional Autónoma de MéxicoE-mail: [email protected]
(Recibido: abril de 2006; aceptado: noviembre de 2007)
Resumen
En este artículo se presenta un método de optimización nuevo y diferente a los
utilizados actualmente, como en el “Método Simplex”. Se basa en el empleo de los
espacios covariante y contravariante, ambos espacios biortogonales entre sí, lo
que permite una visualización del problema de optimización tanto física como
matemática. El resultado obtenido proporciona la mejor aproximación de acuerdo a
los datos concentrados en las restricciones del problema, éstas últimas
visualizados como vectores (como un espacio completo o incompleto) y no como
rectas, planos o hiperplanos. Asimismo, con este nuevo método se puede
cuantificar el error generado entre los vectores aproximación y el objetivo, lo que
permite observar y medir la efectividad de la solución propuesta.
Descriptores: Métodos de optimización, espacio covariante (espacio de
columnas) y contravariante (matriz inversa) –vs– método simplex, rotación de
hiperplano, convergencia, solución exacta.
Abstract
In this pa per a new op ti mi za tion method is pre sented. The the o ret i cal back ground
is dif fer ent to that used pres ently as in the case of the “Sim plex Method”. The pre -
sen ta tion is based on the use of the covariant and contravariant spaces, both be -
ing biorthogonal spaces, al low a vi su al iza tion of the op ti mi za tion prob lem from a
phys i cal as well as math e mat i cal points of view. The ob tained re sult pro vides the
best ap prox i ma tion ac cord ing to the data pro vided in the con straints of the pro-
blem, which are vi su al ized like vec tors and not like straight lines, planes or
hyperplanes. Also, in this new method the er ror gen er ated be tween the ap prox i ma -
tion and the ob jec tive vec tors can be mea sured, which al lows to ob serve and prove
the ac cu racy of the pro posed so lu tion.
Key words: Op ti mi za tion meth ods, covariant and contravariant spaces –vs– sim -
plex method, hyperplane ro ta tion, con ver gence, ex act so lu tion.
InvesInves tiga
tiga
cionescionesEstudios eEstudios e
RecientesRecientes
Introducción
Bien es sabido que dentro de los márgenes decualquier problema práctico, lo que se busca es elmejor empleo de los recursos humanos, comer-ciales, laborales, tecnológicos, etc., de tal maneraque se logre la distribución y uso más ventajoso delos mismos. Es por eso que surgen modelos quetratan de optimizar los recursos disponibles, yasean maximizando ganancias o minimizando gas-tos o pérdidas.
Los problemas de optimización se presentan enmúltiples disciplinas, teniendo en común una meta por alcanzar, sujeta a restricciones que influyen demanera directa limitando las posibles soluciones al problema de maximizar o minimizar el objetivo pro-puesto. Por ejemplo; en administración, un obje-tivo muy común es el de maximizar las ganancias,tomando en cuenta los límites impuestos por lostiempos de operación, costos de producción, ca-pital disponible para la inversión, entre otros fac-tores; a nivel industrial, los gastos de operación seencuentran sujetos a la eficiencia de la maqui-naria, a los productos manufacturados o la llegadade materia prima.
Fue alrededor de la Segunda Guerra Mundial en que se iniciaron los primeros pasos hacia la bús-queda de modelos matemáticos que resolvieranlos problemas de optimización, uno de estos mo-delos surge con el fin de resolver los problemas deasignación de recursos por parte de la fuerza aérea estadounidense. George B. Dantzig, miembro delproyecto SCOOP (Scientific Computation of Opti-mun Programs) de la fuerza aérea de E.U., fuequien diseñó el método simplex de solución en1947, modelo que sigue siendo ampliamente utili- zado hasta nuestros días (Fraleigh y Beauregard,1989a).
El desarrollo de la programación lineal, es con-siderado por mucha gente como uno de los avan-ces científicos más importantes de la segundamitad del siglo XX. De hecho, una proporción im-portante de todo el cálculo científico que se lleva a
cabo por computadoras se dedica al uso de la pro-gramación lineal y a técnicas íntimamente relacio-nadas, estimándose en un 25%, de acuerdo a unestudio de la IBM (Marrero et al, 2006).
Un modelo de programación lineal, como el mé- todo simplex o el que se desarrolla en este artículoempleando los espacios covariante y contrava-riante, tratan de proporcionar una vía eficientepara determinar una solución óptima para losproblemas de maximización o minimización de unobjetivo dadas determinadas restricciones.
Método Simplex
Análisis gráfico
El método simplex busca resolver problemas deprogramación lineal; dicho método, cuando poseedos variables de optimización es visto de maneragráfica como la traza de planos dados por lasecua- ciones de las restricciones, generándose unpolí- gono al graficar todas éstas. Al desplazar latraza del plano de la función objetivo hacia elpolígono mencionado anteriormente, se obtieneuna solu- ción óptima en el primer punto en queambos se intersectan.
Para mostrar lo anterior, se toma un ejemplo de Fraleigh y Beauregard (1989b), donde se proponeel siguiente problema:
Ejemplo 1
Sea una compañía maderera que posee dos talle-res de contrachapado, donde se producen los tresmismos tipos de tableros, hallar el número de díasque debe operar cada taller durante un semestrepara proporcionar de la manera más económicalos tableros requeridos. La tabla 1 muestra la pro-ducción y costo diarios por taller.
186 INGENIERIA Investigación y Tecnología FI-UNAM
Programación lineal con espacios covariante y contravariante. Una perspectiva física y matemática
Vol.IX No.3 -julio-septiembre- 2008 187
J.L. Urrutia-Galicia, J.C. Alcérreca-Huerta y M.A. Ordaz-Alcántara
Con los datos contenidos en la tabla podemos de-terminar tanto la función objetivo como las restric-ciones que intervienen en el problema:
Minimizar C=3000x1 +2000x2 (1)
condicionado a las siguientes restricciones:
100x1 +20x2 ³ 200040x1 +80x2 ³ 3200 (2)60x1 +60x2 ³ 3600
y con x x1 20 0³ ³, .
En la figura 1, se encuentra achurado el espacio solución limitado por las gráficas de las trazas de
los planos de las restricciones; asimismo, con línea punteada, se encuentra graficada la pendiente dela función objetivo. Al desplazar la función objetivohacia el polígono e intersectarse, como se muestra en la figura 2, se obtiene la solución óptima, queresulta ser x1 10= y x2 50= .
Al sustituir los valores de x1 y x2 en la funciónobjetivo de costo inicialmente planteada, se tieneque el costo mínimo de producción sería:
C
C
= +
=
3000 10 2000 50
130 000
( ) ( )
$ (3)
Algoritmo del método simplex
La forma analítica del método simplex funciona demanera similar al método gráfico, la diferencia ra-dica en que para buscar la intersección entre el polí-gono y la traza de la función objetivo se recorrenlas aristas del polígono o poliedro generado por lasrestricciones, siendo los vértices o puntos esquinalas soluciones factibles al problema, sin necesidadde probar todos los puntos esquina. Para iniciar elrecorrido a lo largo del polígono o poliedro, es ne-cesario añadir a las restricciones, representadascon igualdades o desigualdades como: variables
Tabla 1
Tipo decontrachapado
Producción por día DemandasemestralTaller 1 Taller 2
1 100 20 2000
2 40 80 3200
3 60 60 3600
Costos diarios $3000 $2000
Figura 1
de holgura, variables excedentes y variables arti-ficiales, esto último con el motivo de convertir to-das las desigualdades de las restricciones en igual- dades, además de que con ello se genera un con-junto de variables básicas y otro de variables nobásicas con lo que se puede empezar dicho recorrido.
Primeramente se comienza en cualquier puntoesquina, para después moverse hacia cualquierotro adyacente, de manera que la función objetivose incremente lo más rápidamente posible (Fra-leigh y Beauregard, 1989c), para hacer lo anterior, una variable básica se hace no básica y viceversa,disponiendo del conjunto de variables no básicasgenerado al introducir las variables de holgura, exce-dentes y artificiales. Un óptimo se alcanza cuandoel valor de la función es máximo y ninguna otrasolución básica factible puede ser encontrada(Bhatti, 2000).
En caso de que se busque minimizar una fun-ción objetivo, cuyas restricciones sean de la for-ma Ax b£ , con b ³ 0, se hace uso de la siguienteexpresión:
[Mínimo de f x( )]=– [Máximo de – f x( )] (4)
Empleando el problema mostrado anteriormenteen el método gráfico, se ejemplifica de manerabreve, la forma de resolución a través del algoritmo del método simplex.
Una vez que se han obtenido la función objetivo(1) y las restricciones del problema (2), se procede a convertir las desigualdades de las restriccionesen igualdades por medio de la adición, en este ca-so, de variables excedentes y artificiales, por lo que se tiene:
100 20 2000
40 80 3200
60 60
1 2 1 1
1 2 2 2
1 2
x x y q
x x y q
x x
+ - + =
+ - + =
+ - + =y q3 3 3600
(5)
Dado que se desea minimizar la funciónobjetivo C (1) es necesario utilizar la expresiónmostrada en (4). Aún cuando las restriccionesdeban tener la forma Ax b£ , la cuestión se veresuelta tras la añadidura de las variablesexcedentes.
Las variables artificiales deberán tomar el valorcero para obtener una solución factible al proble-ma original. Entonces el problema de minimizar C
188 INGENIERIA Investigación y Tecnología FI-UNAM
Programación lineal con espacios covariante y contravariante. Una perspectiva física y matemática
Figura 2
se transforma en un problema de maximizar P=–C, siendo la nueva función objetivo:
P x x Mq Mq Mq= - - - - -3000 20001 2 1 2 3 (6)
Donde M es un número muy grande, lo que per- mite que la función objetivo no se pueda optimizarsin que los qi tomen el valor cero, como se men-cionó arriba.
Una vez modificadas las restricciones y la fun-ción objetivo, se elabora una tabla inicial donde sehallan concentradas todas las variables de las res-tricciones (5) y el objetivo.
Para la formación de la última fila de la tabla ini- cial, correspondiente al objetivo, se tiene que parauna columna etiquetada con una variable xi, seañade en la fila objetivo el negativo del producto de M por la suma de coeficientes que multiplican a xi
en las restricciones. En las columnas etiquetadascon yi se añade M, mientras que en las etiquetadas con qi se escriben ceros; en la última columna setiene el negativo del producto de M por la suma delos términos independientes de las restricciones.
A continuación, mediante un tipo de reducción deGauss-Jordan, las variables básicas se hacen nobásicas y viceversa, hasta que se obtiene la so-lución óptima al no quedar registros negativos dela fila objetivo y si ninguna variable artificial es bá-sica o si todas las variables artificiales básicas tienenvalor cero, como se muestra en las tablas 2 a 4.
En la tabla 4, se encuentran los valores de x1 10= y x2 50= , obteniéndose el máximo de Pigual con -130000. Al emplear nuevamente la ex-presión señalada en (4), se tiene que el costo mí-nimo de producción es de $130000, solución quese obtuvo con el método gráfico.
No obstante, hay que destacar que aunque sesatisficieron las restricciones del problema, se pue- de observar en la última columna de la tabla 4 quela variable excedente y2 tiene un valor igual con1200, indicativo de una sobreproducción del con-trachapado 2 producido por ambos talleres y que,al comparársele con la demanda semestral del pro-ducto que es igual con 3200 representa el 37.5%de la ya mencionada demanda, por lo que seríarecomendable encontrar una solución alternativa.
Vol.IX No.3 -julio-septiembre- 2008 189
J.L. Urrutia-Galicia, J.C. Alcérreca-Huerta y M.A. Ordaz-Alcántara
Tabla inicial
x1 x2 y1 y2 y3 q1 q2 q3
q1 100 20 -1 0 0 1 0 0 2000
q2 40 80 0 -1 0 0 1 0 3200 ~
q3 60 60 0 0 -1 0 0 1 3600
P3000 2000 0 0 0
-200M -160M M M M -8800M
Tabla 2
x1 x2 y1 y2 y3 q1 q2 q3
x1 1 0.2 -0.01 0 0 0.01 0 0 20
~ q2 0 72 0.4 -1 0 -0.4 1 0 2400 ~
q3 0 48 0.6 0 -1 -0.6 0 1 2400
P0 1400 30 -30 0 0 -60000
-120M -M M M 2M -4800M
Método con espacios covariante ycontravariante
Este método se basa principalmente en una visiónfísica y matemática de los problemas, por lo quelas soluciones encontradas responden a diversassituaciones planteadas en la realidad. Como severá, las variables de holgura, excedentes y artifi-ciales, que son introducidas en el método simplex,no representan absolutamente nada al utilizar elnuevo método, ya que no forman parte del proble-ma original.
Urrutia (2003), mostró la metodología parainvertir matrices rectangulares y para modificaróptimamente las restricciones (cuando esto esposible o mandatario), la cual tiene aplicación para la optimización de funciones dadas determinadasrestricciones.
Con el motivo de hacer hincapié en el trata-miento físico que se hará al problema, las restric-ciones (2) del problema presentado, son escritasde la siguiente manera:
x x1 2
100
40
60
20
80
60
2000
3200
3
×
æ
è
ççç
ö
ø
÷÷÷
+ ×
æ
è
ççç
ö
ø
÷÷÷
³
600
æ
è
ççç
ö
ø
÷÷÷ (7)
donde las ecuaciones de las restricciones sonvistas como una combinación lineal de dos vec-tores en la que las variables de optimización x1 y x2
son escalares que multiplican a los vectores:
~( )f1 = 100 40 60 T y
~( )f2 20 80 60= T
respectivamente, para obtener como objetivo
~ ( )v T= 2000 3200 3600
Por otra parte, el fin sigue siendo minimizar lafunción costo mostrada en (1):
C=3000x1 +2000x2
Las restricciones del problema, en este caso,son de la forma Ax b³ ; sin embargo, lo deseable
190 INGENIERIA Investigación y Tecnología FI-UNAM
Programación lineal con espacios covariante y contravariante. Una perspectiva física y matemática
Tabla 3
x1 x2 y1 y2 y3 q1 q2 q3
x1 1 0 -0.0111 0.0028 0 0.0111 -0.0028 0 13.33
~ x2 0 1 0.0056 -0.0139 0 -0.0056 0.0139 0 33.33 ~
q3 0 0 0.3333 0.6667 -1 -0.3333 -0.6667 1 800
P0 0 22.222 19.44 -22.22 -19.44 0 -106667
-0.333M -0.667M M +1.333M +1.667M -800M
Tabla 4
x1 x2 y1 y2 y3 q1 q2 q3
x1 1 0 -0.0125 0 0.0042 0.0125 0 -0.0042 10
~ x2 0 1 0.0125 0 -0.0208 -0.0125 0 0.0208 50
y2 0 0 0.5 1 -1.5 -0.5 -1 1.5 1200
P0 0 12.5 0 29.17 -12.5 -29.17 -130000
+M M +M
en un problema de optimización es lograr la igual-dad en las restricciones, es decir, que se obtengala solución a Ax b= o en donde Ax b- resulta míni- ma. El método con espacios covariante y contra-variante (de cálculo tensorial) busca cumplir condicha igualdad, por lo tanto, al aplicar el método se sustituye el signo de desigualdad y se cambia porel de igualdad en miras de conseguir la mejor so-lución y de emplear sin dificultades la metodo-logía para invertir matrices rectangulares. Para pa-sar de la desigualdad a la igualdad no es nece-sario añadir ningún tipo de variable como sucedeen el método Simplex, sino que se busca resolverel problema con las variables presentes en el pro-blema original. Así entonces, las restricciones deeste problema se escriben como sigue:
x x1 2
100
40
60
20
80
60
2000
3200
3
×
æ
è
ççç
ö
ø
÷÷÷
+ ×
æ
è
ççç
ö
ø
÷÷÷
=
600
æ
è
ççç
ö
ø
÷÷÷ (8)
A continuación se agrupan los vectores ~
,~
f f1 2 ylas variables de optimización como se muestra:
100
40
60
20
80
60
2000
3200
3600
1
2
æ
è
ççç
ö
ø
÷÷÷
×æ
èçç
ö
ø÷÷ =
æx
xè
ççç
ö
ø
÷÷÷ (9)
La matriz que agrupa a los vectores ~
,~
f f1 2 ,(pertenecientes al espacio covariante) se le desig-nará con el nombre de A; al conseguir la inversapor la izquierda de dicha matriz (A-1) escrita en laforma estándar
A- =-
-1 0 010714 0 003571 0 00119
0 007143 0 010714 0 004
. . .
. . . 762
æ
èçç
ö
ø÷÷ (10)
se obtienen los vectores
~( . . . )f 1 = -0 0101714 0 003571 0 00119 T
~( . . . )f 2 = -0 007143 0 010714 0 004762 T
que por conveniencia en la visualización de lamatriz conformada por vectores es mejor escribir:
AT- = -
-1
0 010714
0 003571
0 00119
0 007143
0 010714
0 00
.
.
.
.
.
. 4762
æ
è
ççç
ö
ø
÷÷÷ (11)
Al multiplicar (8) por los vectores ~f 1 y
~f 2 (per-
tenecientes al espacio contravariante) servirán pa-ra hallar los valores de las variables de optimi-zación:
(~ ~ ~)
~x x1 1 2 2
1× + × = ×f f n f (12)
x x1 2
100
40
60
20
80
60
2000
3200
3
×
æ
è
ççç
ö
ø
÷÷÷
+ ×
æ
è
ççç
ö
ø
÷÷÷
=
600
0 010714
0 003571
0 00119
æ
è
ççç
ö
ø
÷÷÷
é
ë
êêê
ù
û
úúú
× -
æ
è
.
.
.
ççç
ö
ø
÷÷÷
(~ ~ ~)
~x x1 1 2 2
2× + × = ×f f n f (13)
x x1 2
100
40
60
20
80
60
2000
3200
3
×
æ
è
ççç
ö
ø
÷÷÷
+ ×
æ
è
ççç
ö
ø
÷÷÷
=
600
0 007143
0 010714
0 004762
æ
è
ççç
ö
ø
÷÷÷
é
ë
êêê
ù
û
úúú
×
-
-
.
.
.
æ
è
ççç
ö
ø
÷÷÷
al efectuar las operaciones señaladas en (12) y(13), se obtienen los valores de x1= 14.285714 yx2= 37.142857 que, al ser sustituidos primero enla ecuación (2) nos daría la siguiente producción:
14 2857
100
40
60
37 1428
20
80
60
2
. .
æ
è
ççç
ö
ø
÷÷÷
+
æ
è
ççç
ö
ø
÷÷÷
=
171 426
3542 852
3085 71
.
.
.
æ
è
ççç
ö
ø
÷÷÷
En seguida se sustituyen x1= 14.285714 y x2=37.142857 en la función costo (1) proporcio-nando el valor mínimo de costos de producción y el cual resulta ser menor al obtenido con el métodosimplex:
Vol.IX No.3 -julio-septiembre- 2008 191
J.L. Urrutia-Galicia, J.C. Alcérreca-Huerta y M.A. Ordaz-Alcántara
C = +3000 14 285714 2000 37 142857( . ) ( . ) C = $ .117142 86 (14)
Haciendo la consideración de que se trabajan 8horas por día, los valores de x1 y x2 al ser frac-cionarios significan que se deben trabajar 14 díasnormales laborables más 2.25 horas extras paraterminar la producción en el taller 1 y 37 días con1.14 horas en el taller 2.
Como se puede apreciar en la figura 3, losvectores x1 1×
~f y x2 2×
~f se encuentran en un plano
diferente al del objetivo ~n; por lo que no se puedegenerar una solución exacta, siendo el mínimoerror la proyección del objetivo sobre el planogenerado por
~f1 y
~f2 .
Aun cuando ya han sido encontrados los valores de las variables de optimización, es necesario en-tender qué es lo que se hizo matemáticamente,por ello, se recurre a la explicación física que vaíntimamente ligada con los resultados y el proce-dimiento realizado. Así, al sustituir en la ecuación(8) los valores de x1 y x2 obtenidos con este mé-todo, se obtiene el vector aproximación
~ ( )p T= 2171 3543 3086
Este último vector (~p ) resulta de aplicar la ley delparalelogramo de composición de fuerzas de física, también llamada Principio de Stevin, entre los vec-tores x1 1×
~f y x2 2×
~f , y que se expresa matemá-
ticamente en las ecuaciones (15) y (16).
14 285714
100
40
60
37 142857
20
80
60
. .
æ
è
ççç
ö
ø
÷÷÷
+
æ
è
ççç
ö
ø
÷÷÷
=
2171 429
3542 857
3085 714
2000
3200
3600
.
.
.
æ
è
ççç
ö
ø
÷÷÷
»
æ
è
ççç
ö
ø
÷÷÷ (15)
1428 572
571 429
857 143
742 857
2971 428
22
.
.
.
.
.
æ
è
ççç
ö
ø
÷÷÷
+
28 571.
æ
è
ççç
ö
ø
÷÷÷
=
(16)2171 429
3542 857
3085 714
2000
3200
3600
.
.
.
æ
è
ççç
ö
ø
÷÷÷
»
æ
è
ççç
ö
ø
÷÷÷
Al comparar la producción obtenida (16) de loscontrachapados 1, 2 y 3 con la demandada por el
192 INGENIERIA Investigación y Tecnología FI-UNAM
Programación lineal con espacios covariante y contravariante. Una perspectiva física y matemática
22
~f×x
Aproximación
Objetivo Error
Figura 3
vector objetivo ~ ( )n = 2000 3200 3600 T , se tie- ne una sobreproducción del 8.6% y 11.1% en elcontrachapado 1 y 2 respectivamente, y una sub-producción del 14.3% del tercer contrachapado.
Esta solución, siendo una mala aproximación,es sin embargo la mejor, pues aun sumando losporcentajes de sobreproducción y subproducción,obtenidos previamente, no superan al error del37% de sobreproducción que representa optar porla solución calculada con el método simplex; ade-más, nada se puede hacer bajo las actuales polí-ticas de producción impuestas por los números enlas columnas de la ecuación (2).
El vector aproximación ~p obtenido, resulta ser la proyección del vector objetivo:
~ ( )n = 2000 3200 3600 T
sobre el plano generado por los vectores ~f1 y
~f2 .
Se puede observar en la figura 3 que el vector error debe ser ortogonal al vector aproximación con elmotivo de que el error sea mínimo y, por tanto,obtener la mejor solución al problema.
Para comprobar la ortogonalidad entre losvectores aproximación y error, y de que se obtuvocomo consecuencia la mejor solución posible, sedebe efectuar un producto punto entre dichos vec-tores, de tal modo que el resultado sea cero.
La diferencia entre los vectores objetivo y apro-ximación da lugar al vector error
~ ~ ~e v p= - (17)
cuya característica, como se dijo anteriormente, es que debe de ser ortogonal al plano donde selocalizan
~f1 y
~f2 , lo cual significa que se obtuvo la
mejor aproximación, pues cualquier otra solucióngenerará un vector error mayor en magnitud, quees absolutamente indeseable.
Al calcular el vector error generado con estemétodo (~eC ) se obtiene lo siguiente:
~eC =
2000
3200
3600
2171 429
3542 857
3085 714
æ
è
ççç
ö
ø
÷÷÷
-
æ
è
ç.
.
.
çç
ö
ø
÷÷÷
=
-
-
æ
è
ççç
ö
ø
÷÷÷
171 429
342 857
514 286
.
.
.
(18)
y cuando se efectúa el producto punto entre ~eC y el vector aproximación ~p se obtiene el siguiente re-sultado:
-
-
æ
è
ççç
ö
ø
÷÷÷
×
171 429
342 857
514 286
2171 429
3542 857
.
.
.
.
.
3085 714
0
.
æ
è
ççç
ö
ø
÷÷÷
= (19)
con lo que se demuestra la ortogonalidad entre lasolución obtenida ~p y el error ~eC con el método deespacios covariante y contravariante al generar elmínimo error posible.
Si se calcula el vector error que se genera alemplear la solución obtenida con el método sim-plex (~eS ), se obtendría primeramente que el vectoraproximación sería
10
100
40
60
50
20
80
60
2000
4400
360
æ
è
ççç
ö
ø
÷÷÷
+
æ
è
ççç
ö
ø
÷÷÷
=
0
2000
3200
3600
æ
è
ççç
ö
ø
÷÷÷
»
æ
è
ççç
ö
ø
÷÷÷ (20)
y empleando (16), se tiene
~eS =
2000
3200
3600
2000
4400
3600
0
12
æ
è
ççç
ö
ø
÷÷÷
-
æ
è
ççç
ö
ø
÷÷÷
= - 00
0
æ
è
ççç
ö
ø
÷÷÷ (21)
Una vez que han sido calculados los vectoreserror que se generan con ambos métodos, pormedio del concepto de norma de un vector sepueden comparar ambos resultados de donde setiene lo siguiente:
~ ( ) ( ) ( ) .eC = - + - + =171 343 514 641 4272 2 2
~ ( ) ( ) ( )eS = + - + =0 1200 0 12002 2 2 (22)
Vol.IX No.3 -julio-septiembre- 2008 193
J.L. Urrutia-Galicia, J.C. Alcérreca-Huerta y M.A. Ordaz-Alcántara
\ <~ ~e eC S (23)
En la figura 4 se pueden observar las dos solu- ciones que se generan con ambos métodos desdeel punto de vista físico, además del resultadoobtenido en (23). Para no confundir entre las solu-ciones encontradas, los valores de las variables deoptimización del método simplex se denotan con x S1 y x S2 , asimismo, para el vector aproximaciónse le designa con el nombre de ~pS , mientras quelos encontrados por medio de los espacioscovariante y contravariante son denotados por x C1 ,x C2 y el vector aproximación por ~pC .
Restricciones xi
³ 0
Para el último ejemplo, no se hizo uso de lasrestricciones x x1 20 0³ ³, , debido al enfoque fí-sico y gráfico mostrado con anterioridad; sin em-bargo, siendo estrictos estas dos restricciones de-ben de ser consideradas dentro del conjunto derestricciones del problema por lo que se tendría elsiguiente planteamiento global:
minimizar C x x= +3000 20001 2
sujeto a
100 20 20001 2x x+ ³40 80 32001 2x x+ ³60 60 36001 2x x+ ³ (24)1 0 01 2x x+ ³0 1 01 2x x+ ³
por lo que ahora se tendría, escrito a manera decombinación lineal y en la forma Ax b= :
x x1 2
10
40
60
1
0
20
80
60
0
1
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
+
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
=
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
2000
3200
3600
0
0
(25)
de donde se observa que los vectores
~f1 =( )100 40 60 1 0 T
y~f2 =( )20 80 60 0 1 T
194 INGENIERIA Investigación y Tecnología FI-UNAM
Programación lineal con espacios covariante y contravariante. Una perspectiva física y matemática
22
~f×Cx
Ce~
Se~
Sp~Cp~
22
~f×Sx
Objetivo
11
~f×Cx
11
~f×Sx
Figura 4
pertenecen al espacio Â5 , por lo que su represen-tación gráfica resulta imposible, no así su inter-pretación física.
Siguiendo con la metodología de los espacioscovariante y contravariante tenemos que
~
.
.
.
.
.
f 1
3
3
4
0 010712
3 57 10
1 191 10
1 289 10
1 091 1
=
-
-
-
-
-
x
x
x
x 0 4-
æ
è
ççççççç
ö
ø
÷÷÷÷÷÷÷
Y
(26)
~
.
.
.
.
.
f 2
3
3
4
7 14 10
0 0107119
4 761 10
1 091 10
1 8844
=
-
-
-
-
-
x
x
x
x10 4-
æ
è
ççççççç
ö
ø
÷÷÷÷÷÷÷
que al multiplicar (25) de manera similar a la mos-trada en (12) y (13), se obtienen los valores de x1=
14.287924 y x2 = 37.137416.
Empleando estos nuevos valores y sustituyén-dolos en la función costo (1) se tiene:
C = +3000 14 287924 2000 37 137416( . ) ( . ) (27)C = $ .117138 61
que resulta ser un valor más pequeño en costosrespecto al valor obtenido en (14).
El vector aproximación resulta ahora de:
~ ( . .p = 2171 541 3542 51
3085 52 37 137 14 288. . . )T
con lo que se puede calcular el vector error y portanto, la norma del mismo:
~
.
.
eC =
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
-
2000
3200
3600
0
0
2171 541
3542 51
3085 52
37 137
14 288
171 541
342 5
.
.
.
.
.
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
=
-
- 1
514 48
37 137
14 288
.
.
.
-
-
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
(28)
~ .eC = 642 66 (29)
La nueva solución genera un error mayor, de-bido a la introducción de las nuevas restricciones.Pese a lo anterior se sigue cumpliendo la ecuaciónmostrada en (30), así como la ortogonalidad entrelos vectores aproximación y error
~ ~e pC × = 0 (30)
Dado que ~f1 y
~f2 son los vectores que forman
la combinación lineal en las restricciones del pro-blema para cumplir al objetivo ~n, ecuaciones (8) y(25), es de esperar que si se cambian los valoresque conforman los vectores antes mencionados lasolución al problema también lo haga. Las restric-ciones del problema son las que limitan en mayormedida las posibles soluciones al mismo.
La solución del problema de optimización quese obtiene con el método de espacios covariante ycontravariante, gira esencialmente en torno de laeficiencia en el cumplimiento de las restricciones ydel error que se genera al verificarlas. Mientrastanto, la función objetivo funge como un resultadofinal cuantitativo de la calidad de las decisionestomadas, es decir, la función objetivo engloba demanera numérica las consecuencias de tomar encuenta los valores que pretenden satisfacer lasrestricciones propuestas.
La visualización y el entendimiento de los pro-blemas de optimización, se refleja inmediatamente en las decisiones tomadas, así como en la capa-cidad de reacción de una empresa. El siguienteejemplo muestra que aún cuando el objetivo no sepuede alcanzar, la cuantificación del error per-mite tomar decisiones de qué tan eficaz es la so-lución presentada para su uso o, definitivamente,
Vol.IX No.3 -julio-septiembre- 2008 195
J.L. Urrutia-Galicia, J.C. Alcérreca-Huerta y M.A. Ordaz-Alcántara
cancelar los planes originales de producción yefectuar cambios mínimos en los mismos que per-mitan alcanzar el objetivo sin error alguno, refleján- dose todo ello en la función objetivo que se propone.
Ejemplo 2
Una compañía llantera tiene tres plantas en lascuales se producen llantas para autos de las si-guientes medidas R15, R14, R13. Es necesariocumplir con la demanda de 1400, 1500 y 15100unidades por semana de cada una de las medidas; sin embargo, a causa del deterioro de la maqui-naria de R13 en una de las plantas (especializadaen esta medida), será empleada solamente lamaquinaria de las dos plantas res- tantes. En laplanta A se producen 12, 19 y 3 llantas por horarespectivamente, y en la planta B se producen 13,8 y 2. Debido a factores de producción, los cos-tos varían de tal modo que el costo promedio uni-tario de cada llanta por hora es de $250. Con lascondiciones antes señaladas se desea optimizarlos costos generados tras el cierre de una de lastres plantas de dicha compañía. En la tabla 5 seconcentra la información mencionada previamente.
El problema queda expresado física y matemá-ticamente de la siguiente manera:
Minimizar C y y= +8500 57501 2 (31)
sujeto a:
y y1 2
12
19
3
1
0
13
8
2
0
1
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
+
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
³
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
1400
1500
15100
0
0
(32)
Aplicando la metodología mostrada con anterio- ridad se tiene que:
~f1 =( )12 19 3 1 0 T y ~f2 =( )13 8 2 0 1 T
y, con los que se obtienen los vectores del espaciocontravariante:
~
.
.
.
.
.
f 1 3
3
0 051139
0 0838408
3 5872 10
9 9274 10
0 013
=
-
-
-
-
x
x
098
æ
è
ççççççç
ö
ø
÷÷÷÷÷÷÷
y
(33)
~
.
.
.
.
.
f 2 3
0 122091
0 077
3 6706 10
0 013098
0 0214816
=
-
-
æ
è
ç
-x
ççççç
ö
ø
÷÷÷÷÷÷
Tomando el signo de igualdad en (32), semultiplican los vectores
~f1 y
~f2 (33), obteniéndose
los valores de y1=108.334 y y2=110.853, que alser sustituidos en (32) dan por resultado el vectoraproximación ~p :
108 3
12
19
3
1
0
110 9
13
8
2
0
1
. .
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
+
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
= (35)
(continúa...)
196 INGENIERIA Investigación y Tecnología FI-UNAM
Programación lineal con espacios covariante y contravariante. Una perspectiva física y matemática
Tabla 5
Medida de Producción por hora Demanda
llanta Fábrica A Fábrica B semanal
R15 12 13 1400
R14 19 8 1500
R13 3 2 15100
Costos por hora $8500 $5750
2741 103
2945 174
546 709
108 334
110 853
.
.
.
.
.
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
»
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
1400
1500
15100
0
0
(35)
Con el vector aproximación ~p y empleando laexpresión (17) se obtiene el vector error:
~ ( . . .e = - -1341 103 1445 174 14553 291 - -108 334 110 853. . )T (36)
Para medir qué tan grande o significativo es elerror respecto de la aproximación y del objetivo
~ ( )n = 1400 1500 15100 0 0 T
es necesario recordar que el vector aproximación ~py el vector error ~e son ortogonales, por lo que segenera un triángulo rectángulo en donde cada lado tiene de magnitud la norma del vector que loforma, es por eso que se calculan las normas decada vector:
~ .e = 14687 05
~ .p = 4063 325 (37)
~ .n = 15238 77
En la figura 5 se muestra el triángulo formadopor las normas de los vectores (37) donde es claroque el vector error ~e resultante es más grande quela mejor aproximación ~p que se pueda encontrar,debido a las condiciones iniciales planteadas
~f1 y
~f2 .
El error generado es consecuencia directa delángulo que existe entre el hiperplano formado porlos vectores
~f1 y
~f2 , y el vector objetivo ~n, el cual
se puede calcular con ayuda de la siguiente ex-presión:
~ ~ ~ ~ cos( )p p× = × ×n n a (38)
de donde se obtiene el valor de a = °74 5353. .
Dicho ángulo, así como la magnitud del vectorerror, son valores que deben tenerse muy en cuen- ta en la toma de decisiones, pues son indicadoresde la viabilidad o inviabilidad de la solución ob-tenida. La factibilidad de la solución es conseguida en el método simplex por medio de un análisis desensibilidad; sin embargo, en el caso del métodocon espacios covariante y contravariante, el ángulo indica de manera directa dicha factibilidad puestoque el ángulo representa la relación entre el vector objetivo ~n y la aproximación ~p contenida en elhiperplano formado por los
~f
i. Por ejemplo, si se
tuviese que el ángulo a es aproximado o tiende a90º, se sabría que el vector aproximación tenderíaal vector cero (~
~p ® 0), y dado que en el cálculo
del vector aproximación se emplearon los esca-lares que proporcionan la solución al problema, setendría una total inviabilidad de la solución, mismoresultado que arrojarían los análisis de sensibilidad del método simplex.
Vol.IX No.3 -julio-septiembre- 2008 197
J.L. Urrutia-Galicia, J.C. Alcérreca-Huerta y M.A. Ordaz-Alcántara
a
p~
v~
e~
Figura 5
Regresando al problema, cuando los valores de y1
y y2 son sustituidos en la función costo (31) setiene que:
C = +8500 108 3 5750 110 9( . ) ( . ) (39)C = $ .1558 225 0
Cuando se procede a la resolución de esteproblema aplicando el método simplex, se obtieneque y1= 5033.33 y y2 = 0.
Con las restricciones escritas de la forma mos-trada en (32) se calculan los vectores aproxima-ción (~pS ) y error (~eS ):
~
.
, ~p eS S=
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
=
-60400
95633
15100
5033 3
0
59000
94133
0
5033 3
0
-
-
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
.
(40)
de donde se tiene que ~ .eS = 111208 9, que al ser comparada con la norma del vector error delmétodo con espacios covariante y contravariante(37) se observa una contrastante diferencia.
Al sustituir los valores de y1 y y2 obtenidos con la solución del simplex, se tiene que la funciónobjetivo (31) asumiría el siguiente valor
C = +8500 5033 33 5750 0( . ) ( )
C=$42 783.33 (41)
que no resulta nada agradable, sobretodo si se lecompara con el resultado obtenido en (39).
Analizando las soluciones presentadas, al apli-car el método simplex, se satisfaría la demanda dellantas a un costo bastante elevado (41), ademásde que se tendría que cerrar la planta B de lacompañía, cuestión que no sería muy aceptabledebido a los costos que esto podría representar.
Al mismo tiempo, los enormes excedentes deproducción de llantas R15 y R14 en la plantarestante podrían desencadenar otros problemasrelacionados con la maquinaria, como puede sersu deterioro inmediato (factor que propició elcierre de la planta C), o una acumulación de in-ventario que se ve reflejado en costos por alma-cenamiento.
Por otro lado, comparando los resultados obte-nidos por el método de espacios covariante y con-travariante se obtiene un valor muy bajo en cuantoal costo de producción de llantas (39), además deque ambas plantas A y B se mantienen operandoconjuntamente sin poner en riesgo la maquinariaque en ellas se dispone. Respecto a los excesos en la producción de llantas R15 y R14 que son de1341 y 1445 respectivamente, y que se observanen los dos primeros elementos del vector error(36), no resultan ser tan grandes como los obte-nidos en el método simplex: 59000 y 94133 paralas llantas R15 y R14, y que se pueden observar en los dos primeros elementos del vector ~eS en laecuación 40.
Mientras tanto, la falta de producción de 14553 llantas R13 que se obtiene por el método conespacios covariante y contravariante, y que semuestra en el tercer elemento del vector error(36), es el reflejo del cierre de la planta C espe-cializada en este ramo y de la incapacidad de lasplantas A y B para poder suplirla.
Dado que ninguna de las dos soluciones pro-puestas resultan ser viables: la del método sim-plex por los altos costos que representa tomardicha solución y la del método con espacioscovariante y contravariante por no cumplir satis-factoriamente con la demanda; debe consi-derarse seriamente un cambio en los niveles deproducción actuales a fin de completar la de-manda propuesta inicialmente y lograr un míni-mo en los costos de producción.
198 INGENIERIA Investigación y Tecnología FI-UNAM
Programación lineal con espacios covariante y contravariante. Una perspectiva física y matemática
Rotación de planos (Cambios deproducción)
Aunque el método con espacios covariante y con-travariante no satisface la demanda, posee unaventaja amplia sobre el método simplex, pues pro-porciona una visualización física del problema, enla cual el resultado obtenido (~)p es la proyeccióndel vector ~n sobre el hiperplano generado por losvectores
~f1 y
~f2 . Puesto que los vectores
~f1 ,
~f2 , y
~n no son coplanares, no se puede obtener unasolución exacta al problema; sin embargo, si losvectores
~f1 y
~f2 son proyectados sobre el hiper-
plano que contiene al vector ~n, se logra que todoslos vectores sean coplanares y alcanzar así unasolución exacta.
La metodología presentada por Urrutia-Galicia(2003), permite realizar lo anterior con base enque el hiperplano que contiene a los vectores
~f1 y
~f2 será rotado un ángulo q hasta alcanzar la posi-
ción en la que el vector ~n se halle contenido enéste, posteriormente los vectores
~f1 y
~f2 son pro-
yectados en el nuevo hiperplano que contiene alvector ~n, (Figura 6).
La rotación del hiperplano, así como la pro-yección de los vectores
~f1 y
~f2 sobre el mismo,
representan los cambios mínimos requeridos enlos niveles de producción a fin de satisfacer lademanda planteada inicialmente, con lo que no seproducirá error alguno después de efectuar dichoscambios.
Continuando con el ejemplo de la compañíallantera, la cual tiene serios problemas con su pro-ducción, es urgente y necesario el cambio en losniveles de producción a fin de sobrellevar su situa-ción actual. Empleando los resultados obtenidoscon el método de espacios covariante y contra-variante, el primer paso es generar el hiperplanoque contenga al vector objetivo (~)n de las res-tricciones, para lo cual se requiere de un vectornormal a dicho hiperplano. Para poder calcular elvector normal, se hará uso de la matriz auxiliar de laecuación 42.
Vol.IX No.3 -julio-septiembre- 2008 199
J.L. Urrutia-Galicia, J.C. Alcérreca-Huerta y M.A. Ordaz-Alcántara
1
~f
2
~f
v~
rotadoHiperplano
Hiperplano
2
~fdeproyección
1
~fdeproyección
Figura 6
B =
-
-
0 091871 0 091312
0 098433 0 098398
0 990894 0 9908
. .
. .
. . 93
0 0 007376
0 0 007548
-
-
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
.
.
(42)
la cual se halla integrada en la primera columnapor el vector ~n normalizado (~nN ) y en la segundapor el vector error ~e normalizado (~eN ).
Al calcular la matriz inversa de B (B-1), se sabeque estará integrada por los vectores contrava-riantes
B - =
-
-1
2 529951 2 529666
2 718302 2 718284
0 504595 0 50
. .
. .
. . 4567
0 099989 0 103745
0 102341 0 106158
. .
. .
-
-
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
(43)
y por lo tanto, el vector
~ ( . . .n = - -2 5297 2 7183 0 5046
- -0 1038 0 1062. . )T
es ortogonal al vector ~nN consecuentemente ~n esel vector normal al hiperplano que contiene alvector ~n.
Al normalizar ~n se puede escribir la ecuación del hiperplano rotado como sigue:
- - + -0 6745 0 7248 0 13451 2 3. . .z z z (44)- - =0 0277 0 0283 04 5. .z z
Al sustituir en (44) los valores de
z z z z1 2 3 4 1= = = =
y despejar el valor de z5 , se obtiene un vectorarbitrario
~ ( . )w T= -1 1 1 1 45 6597
perteneciente al hiperplano rotado que, junto conel vector
~ ( )s T= 14 15 151 0 0
que es 100 veces más pequeño que el vector ~npor conveniencia, será utilizado para obtener lasproyecciones de los niveles de producción actuales
~( )f1 12 19 3 1 0= T y
~( )f2 13 8 2 0 1= T
en el nuevo hiperplano.
Empleando una combinación lineal, cuya formaes análoga a (8) y a (32), se tiene:
k w k s1 2 1× + × =~ ~ ~f
k k1 2
1
1
1
1
45 6597
14
15
151
0
0-
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
+
æ
è
çççççç.
ö
ø
÷÷÷÷÷÷
=
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
12
19
3
1
0
(45)
donde los valores de k1 y k2 se obtienen fácil-mente multiplicando la matriz inversa generadacon los vectores ~w y ~s por (45), de tal modo que k1 0 0134= . y k2 0 0389= . .
Al sustituir los valores k1 y k2 en (45) se obtiene la proyección de
~f1 sobre el hiperplano rotado
(~g1 ):
~g1 =0.0134
1
1
1
1
45 6597-
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
+
.
0 039
14
15
151
0
0
0 5581
0 5971
5 8889
0
.
.
.
.
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
=
.
.
0134
0 612-
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
(46)
Para obtener el valor de la proyección de ~f2
sobre el hiperplano rotado, se procede de manerasimilar:
200 INGENIERIA Investigación y Tecnología FI-UNAM
Programación lineal con espacios covariante y contravariante. Una perspectiva física y matemática
k w k s1 2 2× + × =~ ~ ~f
k k1 2
1
1
1
1
45 6597
14
15
151
0
0-
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
+
æ
è
çççççç.
ö
ø
÷÷÷÷÷÷
=
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
13
8
2
0
1
(47)
obteniéndose los valores de k1 0 131= - . y k2 0 0261= . , que al ser sustituidos proporcionan el vector proyección de
~f2 :
~ ( . . .g2 0 3525 0 3786 3 930= (48)-0 0131 0 5981. . )T
Una vez que han sido encontrados los vectores ~g1 y ~g2 se tiene que la situación de la compañía hacambiado tras realizar los cambios mínimos deproducción representados por los vectores ante-riormente señalados.
De esta manera, el problema precisado por lasrestricciones queda como sigue:
y y1
0 5581
0 5971
5 8889
0 0134
0 612
.
.
.
.
.-
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
+ 2
0 3525
0 3786
3 930
0 131
0 5981
140.
.
.
.
.
-
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
³
0
1500
15100
0
0
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
(49)
Al resolver esta situación por medio del métodocon espacios covariante y contravariante, se tienen los valores de y1= 1523.7 y y2= 1559.14, que alser sustituidos en (49) ofrecen una solución exacta al problema con error cero:
1523 7
0 5581
0 5971
5 8889
0 0134
0 612
.
.
.
.
.
.-
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
+
11559 14
0 3525
0 3786
3 930
0 131
0 5981
.
.
.
.
.
.
-
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
=
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
1400
1500
15100
0
0
(50)
La función de costos, después de los cambiosde producción, se ve modificada por el volumen de producción de llantas por planta manteniéndoseconstante el costo unitario de cada llanta por horaplanteado inicialmente, es decir, en promedio$250 por cada llanta fabricada en cada planta:
C y y= +67082 71 45417 291 2. .C = +67082 71 1523 7 45417 29 1559 14. ( . ) . ( . )C = $ .173 026 336 11 (51)
Sin embargo, aun cuando el problema ha sidoresuelto, es necesario manejar los números parapresentarlos en la situación real propuesta por lacompañía. Es por eso que al efectuar los productos señalados en (50) se tendría, en las tres primerasfilas de los vectores, la producción semanal dellantas para cada una de las plantas A y B:
Considerando que en la semana se trabajan 5días, y que cada día consta de 8 horas, se tendríaque dividir la producción semanal entre 40 paraobtener la producción por hora (ver tabla 7).
Vol.IX No.3 -julio-septiembre- 2008 201
J.L. Urrutia-Galicia, J.C. Alcérreca-Huerta y M.A. Ordaz-Alcántara
Tabla 6
Medida de Producción semanal Demanda
llanta Planta A Planta B semanal
R15 850.46 549.54 1400
R14 909.75 590.25 1500
R13 8973.02 6126.98 15100
En resumen, para la situación que enfrenta lacompañía se presentan tres opciones en donde laviabilidad de la solución propuesta depende, engran medida, de factores inherentes a la produc-ción que podrían ser detonantes de costos muyelevados que alterarían el resultado final; porejemplo, los costos por almacenamiento del pro-ducto sobrante y cierre de una planta como semuestra en el método simplex, el incumplimientode la demanda en el caso del método con espacioscovariante y contravariante, o los costos que re-presentaría un cambio de producción en la últimasolución propuesta, por lo que es necesario ana-lizar profundamente cada una de las solucionespropuestas y en un caso real contemplarlo directa-mente en la función de costo.
Así pues, se tendrían que observar las situa-ciones en que podrían verse aplicadas las solu-ciones antes señaladas. Por ejemplo, en un casode seguridad nacional y que en lugar deproducción de llantas se produjeran distintos tiposde armas y, además se estuviese en guerra, loscostos de fabricación no serían “tan” importantes(sin im- portar cuantos turnos diarios fuerannecesarios) como la satisfacción al 100% de lademanda de- bido al peligro que se enfrentaría elpaís al no cumplirla, por lo tanto, la soluciónmostrada por el método simplex, y la mostrada con los cambios de producción mostrados en la tabla7, serían las óptimas, aceptándose de entre éstasla que menor costo represente. Otro escenario, en
el que la premura de cumplir la demanda no searelativamente urgente, se podría pensar tanto en los cambios de producción como en la construcción oreparación de la fábrica C, mientras lo anterioracontece se podría producir con los niveles mos-trados por la solución con los espacios covariante ycontravariante (34), o con los vistos por la solucióndel método simplex, siendo por supuesto el ópti-mo, el que constituya menores pérdidas para lacompañía.
Conclusiones
Como se vio a lo largo del artículo, existen muchasdiferencias entre el método de espacios covariante y contravariante (álgebra tensorial), y el métodosimplex, motivo por el cual se ha hecho hincapiéen los aspectos más relevantes que puedan inte-resar al lector, lo cual redundará en una mejorcomprensión de la optimización.
Por ejemplo, en el caso del método simplex sepuede hablar de la posible obtención de ceros enlas variables de optimización lo que significaría elnulo funcionamiento del factor que acompaña adichas variables, lo que representa costos o pér-didas. Otro detalle reside en la adición de másvariables de optimización o en el número de rest-ricciones, lo cual complica el tratamiento de losproblemas con el método simplex, requiriendo así,paquetería de cómputo muchas veces especia-lizada en la cual sólo se mantiene un procesomecanizado. Por su parte, el “método tensorial”con espacios covariante y contravariante no com-plica su forma de operación, ya que resulta aná-loga a los ejemplos mostrados, aun cuando seañadan más variables de optimización o restric-ciones. Además, una ventaja adicional del métodocon espacios covariante y contravariante, se mues- tra en la nula participación de la función a opti-mizar, permitiendo reformularla y contemplar másfactores que intervengan en ella, como lo fue en su momento en los cambios de producción.
Un aspecto importante que se señala es lavisualización física que se puede tener para la
202 INGENIERIA Investigación y Tecnología FI-UNAM
Programación lineal con espacios covariante y contravariante. Una perspectiva física y matemática
Tabla 7
Medida de Producción por hora Demanda
llanta Planta A Planta B semanal
R15 21.26 13.74 1400
R14 22.75 14.76 1500
R13 224.33 153.17 15100
Costos por hora inicial
$8500 $5750
Costos por hora modificada
$67 082.71 $45 417.29
resolución de los problemas, pues el mundo enque habitamos no es puramente matemático; espor esto que al añadir las variables de holgura,excedentes y artificiales en el método simplex, seseñala que dichas variables no forman parte delproblema original, por lo que el método con espa-cios covariante y contravariante las omite y selimita a trabajar sólo con la información propor-cionada. También, dicha visualización permite lacuantificación del vector error, el cual fue calcu-lado tanto para el método simplex como para elmétodo con espacios covariante y contravariante,mostrándose en los ejemplos que la magnitud delvector error generado en el método simplex resultamayor que el generado por el método de espacioscovariante y contravariante, pues el primero noposee el concepto de mejor aproximación con losdatos proporcionados y esto se pone de mani-fiesto de manera más explícita en el ejemplo de lacompañía llantera; de igual forma, estos resultadosse reflejan en las funciones que se deseó opti-mizar, siendo el método con espacios covariante ycontravariante el que obtuvo las cifras económicasmás ventajosas, permitiendo además realizar encualquier caso, los cambios de producción perti-nentes que, de otro modo, serían imposibles deobservar con el método simplex. Cabe admitir que si bien el método simplex satisface todas las res-tricciones, irónicamente no arroja el resultado ópti-mo como se demuestra con el vector error, por loque resulta en este sentido mucho más viable elmétodo con espacios covariante y contravariante.
Para finalizar, existe mucha literatura acerca deoptimización y programación lineal, así como dediversos métodos como el simplex que abordanestos temas (Mangasarian, 2004; Lin et al., 1998; Monteiro et al., 2004; Pan, 2005; Byrd et al,2005). Se invita al lector a revisar dichos métodosy a compararlos con el método con espacios co-variante y contravariante, notando que los pri-meros son abordados de manera más complicaday en su mayoría inaccesible para el entendimientode la gran mayoría de la gente, limitándose,desgraciadamente, a ser manejados por personasespecializadas en la materia.
En el caso del nuevo método presentado, todo loque el lector necesita es la cuidadosa lectura delcapítulo 1 del libro de Flügge (1972) sobre defini-ciones básicas de bases covariantes y contrava-riantes y del álgebra relacionada con ellas (Urrutia,2003).
Referencias
Bhatti M.A. Prac tical opti mi za tion methods withmathematica® appli ca tions. NY. Springer Verlag.ISBN 0-387-98631-6. 2000.
Byrd R.H., Gould N.I.M., Nocedal J. and Waltz R.A.On the conver gence of succes sive linear-quadraticprogram ming algo rithm. SIAM J. Optim., 16(2).2005.
Cánovas M.J., López M.A., Parra J. and Toledo F.J.Distance to solvability/ unsolbavility in linearopti mi za tion. SIAM J. Optim., 16(3). 2006.
Flügge W. Tensor anal ysis and continuum me-chanics. NY. Springer Verlag. 1972.
Fraleigh J.B. and Beauregard R.A. Álgebra lineal.Addi son-Wesley Iberoamericana, S.A (1989a).Chapter 9. pp. 441. Líneas 1-6 del pie depágina. ISBN 0201-64420-7.
Fraleigh J.B. and Beauregard R.A. Álgebra lineal.Addi son- Wesley Iberoamericana, S.A. (1989b). Chapter 9. Pp. 440-443. ISBN 0201-64420-7.
Fraleigh J.B. and Beauregard R.A. Álgebra lineal.Addi son- Wesley Iberoamericana, S.A. (1989c). ISBN 0201-64420-7.
Lin Chih-Jen, Fang Shu-Cherng and Wu Soon-Yi.An uncon strained convex program ming approachto linear semi-infinite program ming. SIAM J.Optim., 8(2). 1998.
Mangasarian O.L. Knowl edge-based linear pro-gramming. SIAM J. Optim., 15(2). 2004.
Marrero-Delgado F., Asencio-García J., Abreu-LedónR., Orozco-Sánchez R. and Granela-Martín H.R.Herramientas para la toma de decisiones: Laprogramación lineal (2006). [en línea]. Dispo-nible en: http//www.monografias.com/trabajos6/proli/proli.shtml
Monteiro R.D. and Tsuchiya T. A new iter a tion-complexity bound for the MTY predictor correc-tor algo rithm. SIAM J. Optim., 15(2). 2004.
Vol.IX No.3 -julio-septiembre- 2008 203
J.L. Urrutia-Galicia, J.C. Alcérreca-Huerta y M.A. Ordaz-Alcántara
Pan P.U. A revised dual projec tive pivot algo rithmfor linear program ming. SIAM J. Optim., Vol.16(1). 2005.
Urrutia-Galicia J.L. La matriz inversa generalizada(el espacio contravariante) a-1 de matrices de
orden m n´ con m n³ y la solución cerrada aeste problema. Revista, Ingeniería Investigación y Tecnología, IV(1). Enero-Marzo 2003. Facul-tad de Ingeniería UNAM. ISSN 1405-77.
204 INGENIERIA Investigación y Tecnología FI-UNAM
Programación lineal con espacios covariante y contravariante. Una perspectiva física y matemática
Semblanza de los autores
José Luis Urrutia-Galicia. Obtuvo el grado de ingeniero civil en la Facultad de Ingeniería, UNAM en 1975, asimismo, los
grados de maestría (1979) y doctor (1984) en la Universidad de Waterloo, en Ontario, Canadá. Es investigador del
Instituto de Ingeniería, UNAM en la Coordinación de Mecánica Aplicada. Sus áreas de interés cubren: matemáticas
aplicadas y mecánica teórica, análisis tensorial, estabilidad y vibraciones de sistemas discretos, vigas, placas y
cascarones. Ha recibido reconocimientos como el “Premio al Mejor Artículo” de las Transacciones Canadienses de
Ingeniería Mecánica (CSME) (Montreal, Canadá 1987) por el artículo “The Stability of Fluid Filled, Circular Cylin drical
Pipes, Part II, Exper i mental”, también le fue otorgada la “Medalla Duggan”, que es la más alta distinción otorgada por la
CSME (en la universidad de Toronto, Canadá 1990) por el artículo “On the Natural Frequencies of Thin Simple Supported
Cylin drical Shells”.
Juan Carlos Alcérreca-Huerta. Estudiante de la carrera de ingeniería civil en la Facultad de Ingeniería de la UNAM. Recibió la
medalla Gabino Barreda por sus estudios de preparatoria en la Escuela Nacional Preparatoria “Miguel E. Schulz” de la
UNAM. En 2004, obtuvo tercer lugar de informes técnicos de las estan cias cortas del programa Jóvenes hacia la
Investigación, en el Instituto de Ingeniería con el Dr. J.L. Urrutia Galicia, en las áreas de física, matemáticas y
computación. En el mismo año ganó el segundo lugar en el concurso interpreparatoriano de Matemáticas VI área I, así
como el tercer lugar de Física IV. Actualmente es discípulo del Dr. José Luis Urrutia Galicia.
Miguel Ángel Ordaz-Alcantara. Egresado de la Escuela Nacional Preparatoria No. 2 Erasmo Castellanos Quinto. Fue
merecedor en 2002 de la nominación a la presea Bernardo Quintana al mérito excelencia académica. Además, durante
su estancia en la preparatoria 2 perteneció al programa Jóvenes hacia la investigación realizando cuatro estan cias cortas
en los años de 2003 a 2006, de las cuales una fue en el Instituto de Química, otra en la FES Zaragoza y dos más en el
Instituto de Ingeniería, en esta última institución actualmente es discípulo del Dr. José Luis Urrutia Galicia. En 2005,
obtuvo el segundo lugar en el XIII concurso Feria de las Ciencias de la UNAM con el trabajo “Como funciona una montaña
rusa”. En 2006, ingresó a la carrera de física en la Facultad de Ciencias de la UNAM, en donde actualmente cursa el
tercer semestre.
INGENIERÍA Investigación y Tecnología IX. 3. 205-215, 2008(artículo arbitrado)
Una comparación del desempeño de las cartas de con trol T2de Hotelling y de clasificación por rangos
A performance comparison among the Hotelling T2
and the rank clasification control charts
F. Zertuche-Luis y M. Cantú-SifuentesCorporación Mexicana de Investigación en MaterialesDivisión de Posgrado en Ingeniería Industrial, México
E- mails: [email protected],[email protected]
(Recibido: mayo de 2006; aceptado: diciembre de 2007)
Resumen
En el sector indus trial es funda mental contar con métodos estadísticos que
permitan monitorear eficientemente los procesos de producción, particu-
larmente, cuando las características de calidad son multivariadas. Los procesos
de producción son, generalmente, monitoreados mediante cartas de control, las
cuales dan información gráfica de si el proceso se encuentra o no bajo control.
Bajo esta situación en este trabajo se comparan, mediante simulación, el
desempeño de dos tipos de cartas de control multivariadas: la clásica basada en
el estadístico T2 de Hotelling y una no-paramétrica basada en el concepto de
profundidad de datos. El estudio de simulación fue motivado cuando al estudiar
un proceso de la indu stria automotriz mediante ambos enfoques, las con-
clusiones a las que se llegan son diferentes. Se dan recomendaciones acerca del
uso de una u otra carta de control según sea el comportamiento estadístico del
proceso a monitorear.
Descriptores: Control estadístico del proceso, T2 de Hotelling, normal multiva-
riada, profundidad de datos, gráfica de clasificación por rangos.
Abstract
In the in dus trial sec tor it is fun da men tal to have sta tis ti cal meth ods that al low ef fi -
cient mon i tor ing of pro duc tion pro cesses, par tic u larly when the char ac ter is tics of
qual ity are multivariate. The pro duc tion pro cesses are gen er ally mon i tored by means
of con trol charts, which give graphic in for ma tion that tells if the pro cess is, or not,
un der con trol. In this con text, this ar ti cle, com pares, through sim u la tion, the per for -
mance of two types of multivariate con trol charts: the clas sic chart based on
Hotelling T22 sta tis tics, and a non-parametric chart based on the con cept of data
depth. We de cided to per form the sim u la tion when, study ing a pro cess within the au -
to mo tive in dus try us ing both ap proaches, the con clu sions ar rived at were dif fer ent.
Rec om men da tions are given about the use of one or the other con trol chart in ac cor -
dance with the sta tis ti cal be hav ior of the mon i tored pro cess.
Key words: Sta tis ti cal pro cess con trol, Hotelling T 22, multivariate nor mal ity, data
depth, r-chart.
InvesInves tiga
tiga
cionescionesEstudios eEstudios e
RecientesRecientes
Introducción
Los procesos industriales son generalmente moni-toreados mediante el control estadístico de pro-cesos (CEP). El CEP es la colección de métodosusados para reconocer causas especiales de va-riación y proporcionar medios para llevar un pro-ceso a un estado de control y reducir la variaciónen torno a un valor objetivo dado. Es deseable queel proceso bajo análisis alcance este valor paracada producto. Sin embargo, en cada proceso hayuna variabilidad aleatoria inherente independiente- mente de su diseño y de la precisión de la maqui-naria usada para la producción. El objetivo del CEPes mantener la variabilidad, en torno al valor ob-jetivo, lo más pequeña posible.
Existen al menos dos causas de variabilidad encada proceso de producción. La causa común (oruido blanco) es la variabilidad natural que cadaproceso experimenta. Un proceso que opera so-lamente con este tipo de variabilidad se dice queestá bajo control. Una segunda causa de varia-bilidad es la espe cial (o asignable), la cual es elresultado de factores que no son puramente alea-torios. Estos factores causan heterogeneidad enel proceso y como resultado afectan la calidad del producto. En este caso, se dice que el procesoestá fuera de control. Este último tipo de variabi-lidad puede ser detectada mediante cartas decontrol, que proporcionan una descripción gráficadel proceso y dan a cualquier administrador, cono sin conocimiento estadístico, la información in-mediata de si el proceso está o no bajo control.
Una carta de control es una representación grá- fica de una o varias características del procesobajo investigación, y es la herramienta más usadapara identificar causas especiales de variabilidaden un proceso. Cuando un proceso tiene asociadauna carta de control, se dice que está siendo con-trolado.
Cualquier tipo de carta de control debe de cum- plir al menos las siguientes cuatro condiciones:
1) Una sola repuesta a la pregunta ¿está el proceso bajo control?,
2) Especificación del error tipo I global,
3) Se deben tomar en cuenta la relación entre las características a controlar, y
4) Se debe dar un procedimiento que per- mita responder la pregunta: Si el proce- so está fuera de control ¿cuál es la cau- sa? (Maravelakis et al., 2002).
La grafica de control comúnmente usada es lade Shewart y es útil para controlar una sola ca-racterística del producto. Cuando un productotiene varias características a controlar, general-mente se construye una gráfica de Shewart paracada una de ellas. En este caso, hay dos suposi-ciones subyacentes: sus mediciones sucesivas noestán correlacionadas y se distribuyen normal-mente. Sin embargo, generalmente las carac-terísticas de un producto están correlacionadas detal forma que cambios en una característica pue-den afectar la media o la variabilidad de las res-tantes. Cuando se desean controlar varias carac-terísticas simultáneamente, la herramienta másusada es la carta de control multivariada propuesta por Hotelling basada en el estadístico T2 de Ho-telling (Pignatiello, 1993). Aquí la suposición fuer-te es que las mediciones sucesivas de las carac-terísticas siguen una distribución normal multiva-riada. Sin embargo, la normalidad de las obser-vaciones no siempre puede suponerse.
A fin de salvar estos inconvenientes, un enfoque es monitorear conjuntamente las característicasdel producto sin la suposición de normalidad multi- variada; esto es: usar cartas de control multiva-riadas no paramétricas. Por supuesto, éstas de-berán cumplir con al menos las cuatro condiciones arriba listadas.
En el presente trabajo se estudia un procesoindustrial real mediante técnicas multivariadas noparamétricas, y los resultados se comparan con los
206 INGENIERIA Investigación y Tecnología FI-UNAM
Una comparación del desempeño de las cartas de control T2 de Hotelling y ...
obtenidos usando una carta de control de Ho-telling. Las conclusiones motivan un estudio de si-mulación, cuyo objetivo es comparar el desempe-ño de ambas cartas. Este estudio permite darrecomendaciones acerca del uso de una u otracarta de control según sea el comportamiento es-tadístico del proceso a monitorear.
El proceso se ubica en el ramo automotriz yconsiste en la elaboración de convertidores detorque, tales como el mostrado en la figura 1. Elconvertidor de torque es un dispositivo que seutiliza en los vehículos de transmisión automática para transferir la potencia que genera el motor a lacaja de transmisión. Esto da por resultado el des-plazamiento del vehículo. El convertidor de torquerealiza una función similar a la del embrague en los vehículos de transmisión manual. Las funcionesprincipales de este dispositivo son:
1) Transferir eficientemente la potencia que genera el motor,
2) Aumentar el Torque que es generado por el motor y
3) Transferir eficientemente las rpm del mo- tor a la caja de transmisión.
El Convertidor de Torque es importante en el dise-ño de un vehículo, debido a que proporciona unmejor aprovechamiento de las fuerzas generadaspor el motor para el desplazamiento eficiente delvehículo, generando un aumento de torque y unfácil cambio de velocidades en la caja de trans-misión.
Los ingenieros de planta determinaron que laparte del convertidor que debería de analizarsefuera la bomba. Las características consideradasfueron: altura de pista a buje, diámetro interior debuje y diámetro exterior de buje. Las medicionesde tales características se pueden colectar en unvector tridimensional z donde la primera compo-nente es la altura pista-buje, la segunda el diá-metro interior y la tercera el diámetro exterior.Estas características están naturalmente corre-lacionadas y, por lo tanto, las gráficas de controlunivariadas no son adecuadas.
Análisis del proceso mediante la gráficade control de Hotelling
Las gráficas de control multivariadas están dise-ñadas para monitorear el proceso de producciónde un producto, el cual interesa controlar, con pvariables de calidad posiblemente correlacionadas. La gráfica de control más usada es la llamada T2
de Hotelling. Para su construcción son necesarias
Vol.IX No.3 -julio-septiembre- 2008 207
F. Zertuche-Luis y M. Cantú-Sifuentes
Bomba Estator
Turbina
Damper
Figura 1. Convertidor de Torque
dos fases: En la Fase I se considera un conjunto de m datos históricos supuestamente bajo control ycon distribución normal multivariada; dichos datoshistóricos nos servirán para estimar el vector demedias m, y la matriz de varianzas – covarianzas
å (Mason et al., 2002). Los estimadores resultan ser, respectivamente, X n X= ( / ) '1 1
r, con X una
matriz n x p de datos, donde n m£ es el tamañode un subconjunto adecuado de los datos histó-ricos, y S n X HX= -( / ( )( ' )1 1 , con H I n= - ( / )1 Qr r11 y
r1 representado un vector de unos, con-
formable al producto actual.
Por otra parte, en la Fase II se calcula elestadístico T2 de Hotelling para las medicionesactuales de las variables a controlar, X1, X2,…definido mediante la expresión:
T X X S X Xi i i
2 1= - --( )' ( ) (1)
Se puede demostrar que, bajo la suposición denormalidad, T T1
222, ,... conforman una muestra alea-
toria proveniente de una distribución F (Mason etal., 2002). Este resultado se utiliza, dada a, para fijar el límite de control en la Fase II, calculadocomo:
U C Lp n n
n n pF p n p=
+ -
-
æ
èç
ö
ø÷ -
( )( )
( )( ; , )
1 1a (2)
donde
n es el tamaño de la muestra del conjunto de datos históricos y
F p n p( ; , )a - es el a-ésimo quantil de una distri-
bución F con p y n- p grados de libertad.
Los valores de esta muestra aleatoria se gra-fican conjuntamente con el límite de control deter-minado para completar la construcción de una grá- fica de control T 2 de Hotelling.
La metodología arriba descrita se aplicó am=127 mediciones históricas de convertidores de torque y se determinó que
n=127, X=(2.8363,1.9151,2.5199),
y
S = ´ --1 10
0 6654 0 0084 0 0122
0 0084 0 0257 0 0085
0 012
6
. . .
. . .
. 2 0 0085 0 0869-
æ
è
ççç
ö
ø
÷÷÷. .
El límite de control se fijó en 17.7256. En lafigura 2 se muestra la gráfica de control para 25datos monitoreados.
208 INGENIERIA Investigación y Tecnología FI-UNAM
Una comparación del desempeño de las cartas de control T2 de Hotelling y ...
Figura 2. Gráfica de control T2 de Hotelling para 25 observaciones de las tres vari ables de calidad de convertidores
de torque
Vol.IX No.3 -julio-septiembre- 2008 209
F. Zertuche-Luis y M. Cantú-Sifuentes
En la figura 2 se observa que ningún punto estáfuera de control, y se concluye que el proceso estácontrolado con respecto a la distribución de re-ferencia, en este caso no se determinó si la dis-tribución de referencia en forma conjunta seguíauna distribución normal multivariada, la cual es unsupuesto para poder aplicar en forma correcta lametodología, en la siguiente sección se analiza ladistribución de referencia para verificar la exis-tencia de una distribución normal multivariada yasegurarse de que el análisis de la gráfica T 2 deHotelling era el correcto.
Normal multivariada
El supuesto de normalidad es usual en el aná-lisis estadístico clásico, tanto univariado comomultivariado. En particular, en la construcción degráficas de control de Hotelling el supuesto denormalidad multivariada es central.
Se han desarrollado una gran cantidad demétodos, tanto formales como informales (grá-ficos), para probar la normalidad para datos multi-variados. De los formales, uno de los más potentes es el de Henze-Zirkler. (Mecklin, 2004). Por otraparte, los métodos gráficos permiten, de un golpede vista, decidir si es razonable la suposición denormalidad. De éstos, quizá los más utilizados sonlas Gráficas cuantil-cuantil, o QQ-plot en el lengua- je inglés.
En esta sección se describen y se aplican a losdatos del convertidor de torque el método deHenze-Zirkler y la construcción de la gráfica cuan-til-cuantil.
Gráfica cuantil-cuantil
Como es sabido, siendo x x xn1 2, ,..., una muestrade tamaño n, la gráfica cuantil-cuantil consiste enconstruir un diagrama de dispersión de los puntos ( $( ), ( )) , ,..., ,F x F x i n
i i= 1 2 con
$( )F xn
=1
número de observaciones menores o igualesque x
y
F x f x dxx
x
( ) ( )=-¥ò
Por supuesto, f xx ( ) representa la densidad de ladistribución de interés. Entre más los puntos deldiagrama se parezcan a una línea recta a cuarentay cinco grados, más evidencia se tiene que lamuestra proviene de la densidad f xx ( ).
Cuando se desea ver si el supuesto de norma-lidad multivariada es aceptable, se puede construir una gráfica cuantil-cuantil usando el hecho de quebajo normalidad, las cantidades dadas por:
d x x S x xi i i
2 1= - --( )' ( ) (3)
La cual se distribuye como una X n2 ( )a , con n
grados de libertad. Por esta razón, a esta gráfica se le conoce con el nombre de Gráfica cuantil–cuantilo gráfica Ji-cuadrada (Koziol, 1993). En la figura 3, se muestra la gráfica en papel normal para los da-tos del convertidor de torque.
En la figura 3 se puede observar poca evidenciaque apoye el supuesto de normalidad multivariadaen los datos del convertidor de torque. Si todos losdatos se vieran como los primeros en la gráfica, elsupuesto de normalidad sería razonable.
Prueba Henze–Zirkler
Una prueba estadística para determinar si un con-junto de datos sigue una distribución normal mul-tivariada, conocida por su gran potencia, es laprueba de Henze-Zirkler (Mecklin, 2004). Si x1,x2,…, xn denota una muestra aleatoria de una dis-tribución p variada, entonces, el estadístico de laprueba de Henze-Zirkler se define mediante laexpresión (Henze et al., 1990):
Tn
y yj k
j k
np= - -
æ
èçç
ö
ø÷÷ - + ´
=
-å1
22 1
22
1
2 2exp ( ),
/bb
(4)
exp( )
( ) /-+
æ
èçç
ö
ø÷÷ + +
=
-åb
bb
2
2
2
1
2 2
2 11 2y n
jj
np
Donde,
y y x x S x x yj k j k j k j
- = - - =-2 1 2( )' ( ),| |
( )' ( ) ,x x S x x x Sj j
- --1 y
denotan el vector de medias muestrales y la matrizde varianzas-covarianzas respectivamente. El pará- metro b es un parámetro de suavizamiento,determinado por el tamaño de la muestra y defini-do de la forma siguiente:
bd
p
pnp
n( )/( )
/( )=+æ
èç
ö
ø÷
+
+1
2
2 1
4
1 4
1 4 (5)
Si el conjunto de datos sigue una distribuciónnormal multivariada, el estadístico de prueba T esaproximadamente distribuido lognormal con:
E T p[ ] ( ) /= - + -1 1 2 2 2b ´
(6)
11 2
2
2 1 2
2
2
4
2+
++
+
+
é
ëê
ù
ûú
p p pb
b
b
b2
( )
( )
Var Tpp p[ ] ( ) ( )
( )
/= + + + ++
é
ëê
- -2 1 4 2 1 2 12
1 2
2 2 24
2 2b b
b
b
(7)
++
+
ù
ûú - + +
+é-3 2
4 1 24 1
3
2
2
2
8
2 4
24 8
2
p pw
p
w
p p
w
p( )
( )
( )/b
b
b b
ëê
ù
ûú
donde w = (1+B2 )(1+3B 2 ). Estos resultados son usados para contrastar el siguiente juego dehipótesis:
Ho: Los datos siguen una distribución Normal Mul-tivariada vs.
210 INGENIERIA Investigación y Tecnología FI-UNAM
Una comparación del desempeño de las cartas de control T2 de Hotelling y ...
Figura 3. Gráfica cuantil-cuantil para los datos del convertidor de torque
Ha: Los datos no siguen una distribución Nor-mal Multivariada.
Si, T c> -1 a , con c1 - a el cuantil (1 - a) de unadistribución lognormal con media E[T] y varianzavar[T], se rechaza la hipótesis nula y se acepta encaso contrario.
Para los datos del convertidor de torque, y cona=0.05, se obtienen, para la prueba de Henze-Zirkler, los resultados mostrados en la tabla 1.
Según los resultados de la tabla 1, se rechazala hipótesis nula. Esto es, no es razonable suponerque los datos pueden modelarse mediante unadistribución normal multivariada; con lo que elenfoque de la T 2 de Hotelling para construir unagráfica de control para tales datos no es adecuado. Aún así, sigue siendo deseable el contar con unagráfica de control del proceso de producción deconvertidores de torque. Se puede optar por unenfoque no paramétrico, en el cual la suposiciónde normalidad no es necesaria. En el apartadosiguiente se describe y aplica un método noparamétrico basado en el concepto de profundidad de datos.
Gráficas de control basadas en laprofundidad de datos
Entre los métodos no paramétricos usados en elanálisis de datos se encuentran los métodos deprofundidad de datos. Éstos empezaron práctica-mente con el artículo de Liu (1992). Quizás una de las aplicaciones principales de esta metodología está en el control de calidad. El único reque-rimiento para usar este método, es contar con unadistribución de referencia denotada como F, quedescribe una distribución k ( k ³ 1) dimensional, en la práctica ésta suposición se traduce en contar
con una muestra Y1,…,Ym, llamada muestra dereferencia de vectores k dimensionales (Parelius,1999)
La noción de profundidad de datos se basa enel hecho de que cualquier densidad de proba- bilidades distingue entre puntos “centrales” y“periféricos”. Una función de profundidad asigna acada y R kÎ un puntaje no negativo, el cual puedeinterpretarse como su localización en la nube dedatos. Las profundidades más grandes corres-ponden al centro de la distribución, mientras quelas más pequeñas corresponden a regiones ex-ternas. Este sistema de clasificación por rangos esusado para determinar si una observación es di-ferente de aquellas que conforman el conjuntooriginal. Las funciones de profundidad deben sa-tisfacer un número de propiedades (Zuo et al.,2000): invariante afín, monotonicidad, maxima-lidad al centro, desvanecimiento al infinito. Existen funciones que cumplen con estas propiedades,entre otras, la profundidad de Mahalanobis, la profundidad simplicial y la profundidad de Tukey.De éstas, la más usada, quizá debido a su facilidad de cómputo e interpretación, es la profundidad deMahalanobis denotada por MD yF ( ), y definida co-mo (Liu et al., 1993):
MD yy y
F
F FF
( )[ ( )' ( )]
=+ - -
-
å1
11
m m (8)
Donde,
m F es el vector de medias y
F
-
å1
es la matriz de varianzas-covarianzas de
la distribución de referencia F.
Si los parámetros de la distribución de referenciano son conocidos, la versión muestral de la
Vol.IX No.3 -julio-septiembre- 2008 211
F. Zertuche-Luis y M. Cantú-Sifuentes
Tabla 1. Resultados de la prueba Henze-Zirkler
Tamaño de muestra Variables Estadístico H-Z (T)Valor crítico
( )c1- a
Valor de pP(T³2.8183)
127 3 2.8183 2.6644 0.0211
profundidad de Mahalanobis dada por la ecuación(9 ) es:
MD yy Y S y Y
Fm ( )[ ( )' ( )]
=+ - --
1
1 1 (9)
Donde
Y es el vector de medias muestrales de los datos
Y1,…,Ym y S es la matriz de varianzas-covarian- zas de la muestra de referencia Fm .
Para construir una gráfica de control basada enla profundidad de Mahalanobis, llamada común-mente gráfica de clasificación por rangos (o r-chart en el idioma inglés), se realiza el siguiente procedi- miento:
1. Se calculan el vector de medias, la ma-triz de varianzas-covarianzas y la profundidad decada uno de los datos en Fm , MDFm(yi) i=1,2…m.
2. Se obtienen los estadísticos de orden delas MDFm(yi) i=1,2…m, y se denotan como y [ ] ,1
y [ ]2 , ..., y m[ ].
3. Sean X1 , X2,… las nuevas observacio-nes, las cuales se suponen siguen una distribucióncontinua G. Para cada Xi se obtiene suprofundidad, aplicando la ecuación (9), utilizandoel vector de medias y la matriz devarianzas-covarianzas, de Fm , las cuales sedenotan mediante MDFm(xi) i=1,2,…
4. El estadístico de clasificación por rangos,r(×), para cada nueva observación se calcula mediante:
r xi
( ) = (10)
{ }# | ( ) ( ), ,...,y MD y MD x j m
m
j Fm j Fm i£ =
+
1
1
5. Se grafican los estadísticos de clasificaciónpor rangos de cada Xi contra el tiempo, con un límite central de control CL=0.5 y un límite inferior de control LCL=a. Donde a es llamada la pro-porción de alarma.
Liu (1995) demostró que el estadístico declasificación por rangos sigue una distribución uni-forme en el intervalo [0,1]. La gráfica de clasifi-cación por rangos, llamada también gráfica r, con-trasta sucesivamente las hipótesis:
212 INGENIERIA Investigación y Tecnología FI-UNAM
Una comparación del desempeño de las cartas de control T2 de Hotelling y ...
Figura 4. Gráfica de clasificación por rangos, para los datos del convertidor de torque
Ho: La nueva observación tiene la misma dis-tribución que la distribución de referencia vs.
Ha: Existe un cambio en la ubicación o dis-persión de la distribución de la nueva observacióncon respecto a la distribución de referencia.
Si r xi
( ) se grafica por debajo del LCL, entonces laobservación se declara fuera de control. Esto esuna señal de alerta para los ingenieros del pro-ceso. En la figura 4 se muestra la gráfica de cla-sificación por rangos para los datos del convertidorde torque.
Comparación entre las gráficas T 2 deHotelling y de clasificación por rangos
Conforme a los resultados en los apartados ante-riores, es claro que las conclusiones que se pue-den extraer de un análisis de datos dependen dequé atención se ponga a la verificación de lossupuestos del modelo usado. En este caso, el usodel enfoque de Hotelling en la construcción degráficas de control sin verificar la normalidad de las variables, conduce a la conclusión de que no hayartículos (convertidores de torque) fuera del límitede control. Sin embargo, un enfoque no paramé-trico indica que dos artículos están fuera de con-trol. Esto conduce a las siguientes preguntas: Silos datos hubiesen sido normales ¿Cuál de los dos
enfoques proporciona resultados más adecuados?y ¿cuál es el desempeño relativo de ambas grá-ficas a medida que los datos se alejan de lanormalidad? Estas preguntas se pueden respon-der mediante un estudio de simulación. La expo-sición de los resultados de un estudio tal es elobjeto del siguiente apartado.Los métodos T 2 de Hotelling y no paramétrico fueron aplicados a dos diferentes conjuntos dedatos. El primer conjunto de datos fue obtenidomediante un generador normal multivariado con
X = ( . , . , . ,10 0021 10 4723 10 5201
10 2671 10 3410. , . )
y
S=
3 6176 0 4220 0 2377 01340 0 6456
0 4220 3 4991 0 036
. . . . .
. . .
- -
- 3 01754 0 4368
0 2377 0 0363 3 8034 0 0958 0 2313
0
. .
. . . . .
.
- - - -
- 1340 01754 0 0958 3 7951 0 2406
0 6456 0 4368 0 2313
. . . .
. . .
- -
- -0 2406 31382. .
æ
è
çççççç
ö
ø
÷÷÷÷÷÷
Las cinco variables del segundo conjunto dedatos se generaron como sigue: La primera sigueuna distribución uniforme en el intervalo [10,12].Las cuatro restantes se generaron como una com-
F. Zertuche-Luis y M. Cantú-Sifuentes
Vol.IX No.3 -julio-septiembre- 2008 213
Tabla 2. ARL para el primer conjunto (normal)
Cambio en la medida de las variables Pequeño ( )m s+ 1 Medio ( )m s+ 2 Grande ( )m s+ 3
ARL para las gráficas de rangos 8.0401 2.7301 0.0222
ARL para las gráficas T2 de Hotelling 5.2051 1.9632 0.0179
Eficiencia relativa (ARL T2 / ARL rangos) 0.647 0.719 0.806
Tabla 3. ARL para el segundo conjunto (no normal)
Cambio en la media de la 1a. variable original Pequeño Mediano Grande
ARL para las gráficas de rangos 15.026 5.7708 3.4179
ARL para las gráficas T2 de Hotelling 500 37.6589 5.5748
Eficiencia relativa (ARL T2 / ARL rangos) 33.275 6.525 1.631
binación de la primera y una variable uniforme[0,1]. Para cada conjunto de datos, se generó una distribución de referencia F de 300 observaciones.Después se generaron 500 nuevas observacionespara cada conjunto de datos, con diferentes cam-bios en los valores de las medias de las variables.Estas observaciones constituyen las distribucionesde monitoreo G. Las nuevas observaciones fueronmonitoreadas mediante la gráfica T 2 de Hotelling, y la carta de clasificación por rangos, con una=0.05. Para comparar la eficiencia relativa entrelos dos métodos se usó la longitud promedio decorridas (ARL). Ésta se define como el promedio de puntos dentro de control antes de observar un pun- to fuera de control. El ARL fue calculado con 1,000 simulaciones para cada uno de los cambios en ladistribución de monitoreo: pequeño, medio y gran-de. En las tablas 2 y 3 se presentan el ARL paracada caso y para cada tipo de gráfica.
Cuando las variables son generadas de unadistribución normal, los resultados de la eficienciarelativa en la tabla 2 indican que el ARL de lagráfica T 2 de Hotelling es más pequeño que el ARLdel método no- paramétrico. Sin embargo, cuandoel cambio en la media de las variables incrementa,el ARL de ambos métodos tiende a ser igual. Porotra parte, cuando las variables son generadas deuna distribución no-normal, los resultados de laeficiencia relativa en la tabla 3 indican que eldesempeño del método no paramétrico es mejorque la T 2 de Hotelling.
Conclusiones y trabajo futuro
1. Si los datos del convertidor de torque,no normales, según la Prueba de Henze-Zirkler, semonitorean mediante la Gráfica T 2 de Hotelling seencuentra que ninguno de ellos se sale de control.Sin embargo, cuando se monitorean mediante lagráfica clasificación por rangos se encuentra quehay datos fuera de control. Entonces, se esperaríaque los indicadores de calidad sean mejores cuan-do se calculan mediante el método de Hotelling, ylos ingenieros de planta estarían cometiendo unerror de estimación acerca del proceso.
2. Los resultados de la simulación muestranque el desempeño del método no paramétrico esmejor que el T 2 de Hotelling cuando los datos sonprovenientes de una distribución no-normal multi-variada. Por otro lado, el desempeño de la Gráfica T 2 de Hotelling es más eficiente cuando los datosprovienen de una distribución normal multivariada,a menos que el cambio en la media sea grande,pues en tal caso ambas gráficas parecen tener undesempeño similar.
Después de una amplia revisión bibliográfica nose encontró una metodología para calcular indi-cadores de calidad para cada uno de los dos enfo-ques. Por otra parte, en el método no paramétricono se encontró un método práctico que conduzca a determinar la componente de más influencia enlos puntos fuera de control.
Esto marca pautas para un trabajo futuro:proponer indicadores de calidad para cada uno delos enfoques; y para el caso de la gráfica declasificación por rangos encontrar una metodología para determinar la variable de más influencia.
Referencias
Henze N. and Zirkler B. A class of invariant consis -tent test for multivariate normality. Commun.Stat ist-Theor. Meth., 19(10):3595-3618. 1990.
Koziol J. Prob a bility plots for assessing multivariatenormality. The Stat is ti cian 42. Pp161–174.1993.
Liu R. Data depth and multivariate rank test. Statis -tics and Related Methods. Pp. 279-294. 1992.
Liu R. A quality index based on data depth andmultivariate rank test. Journal Amer ican Statis -tics Asso ci a tion. 91:266-277. 1993.
Liu R. Control chart for multivariate processes.Journal Amer ican Statis tics Asso ci a tion. 90:209-125. 1995.
Maravelakis P.E. and Panaretos J. Effect of esti ma -tion of the process param e ters on the controllimits of the univariate control chart for processdisper sion. Commu ni ca tions in Statis tics, 31(3):443-462. 2002.
214 INGENIERIA Investigación y Tecnología FI-UNAM
Una comparación del desempeño de las cartas de control T2 de Hotelling y ...
Mecklin-Christopher J. An appraisal and bibli og -raphy of test for multivariate normality. Interna-tional Statis tical Review, 72(1):123-138. 2004.
Parelius-Jesse M. Multivariate anal ysis by datadepth: Descrip tive statis tics, graphics andinfer ence. The Annals of Statis tics, 27(3):783-858. 1999.
Pignatiello J.J. On constructing T2 control chart foron-line process moni toring. IIE Trans ac tions,31:529-536. 1993.
Zuo Y. and Serfling R. Struc tural prop er ties andconverge results for contours of sample statis -tical depth func tions. The annals of statis tics,28(2):483-499, 2000.
Bibliografía sugerida
Mason L.R. and Young C.J. Multivariate statisticalprocess control with indus trial applications. Ed.ASA SIAM. 2002.
Vol.IX No.3 -julio-septiembre- 2008 215
F. Zertuche-Luis y M. Cantú-Sifuentes
Semblanza de los autores
Federico Zertuche-Luis. Realizó la licenciatura en ingeniería indus trial en el Instituto Tecnológico de Saltillo en 1992. El
I.T.E.S.M (Campus Monterrey) en 1994, le otorgó el grado de maestro en ciencias en ingeniería indus trial. Actualmente
es candidato a doctor en ingeniería indus trial y de manufactura en el Programa Interinstitucional en Ciencia y Tecnología,
impartido en la Corporación Mexicana en Investigación de Materiales. Desde 1996, se desempeña como profesor
investigador en el Instituto Tecnológico de Saltillo, dentro del área de Posgrado en Ingeniería Indus trial. A partir de 2003,
es miembro del sistema de investigación del estado de Coahuila. Como consultor ha participado en la implementación de
la metodología Seis Sigma en las siguientes plantas: Mabe (Saltillo), Siemens VDO, FEMSA, Lear (Saltillo), Lear (Ramos
Arizpe), Linamar (Saltillo), Linamar (Torreón), Sanmina (Apodaca).
Mario Cantú-Sifuentes. Obtuvo su licenciatura en ingeniería indus trial en el Instituto Tecnológico de Saltillo en 1976.
Asimismo, el grado de maestría en ciencias en estadística en la Universidad Autónoma Agraria Antonio Narro y el grado
de doctor en ciencias en estadística en el Colegio de Posgraduados. De 1977 a 1983, realizó diversos trabajos en la
iniciativa privada y dependencias gubernamentales. Desde 1985, se desempeña como profesor investigador el
Departamento de Estadística de la Universidad Autónoma Agraria Antonio Narro.
INGENIERÍA Investigación y Tecnología IX. 3. 217-229, 2008(artículo arbitrado)
Reducción del retardo en el cambio de canal en servicios IPTV
Reduction of channel zapping delay in IPTV services
F. Moumtadi, M. Escobar-Argota, R. López-Moreno y S. Landeros-AyalaFacultad de Ingeniería, UNAM, México
E-mails: [email protected], [email protected],[email protected] y [email protected]
(Recibido: diciembre de 2006; aceptado: enero de 2008)
Resumen
En el artículo se analiza el retraso que se presenta en un sistema de IPTV cuando un
usuario cambia de canal y se considera un nuevo algoritmo para reducirlo. Basado en
el método de grupos adyacentes, se reduce el tiempo de adquisición del nuevo canal
haciendo el pedido no solamente de ese canal, sino también de los canales
adyacentes a él, tomando como principio que existe un ancho de banda suficiente y un
principio de multicast de la transmisión (Chunglae, 2004). En la parte final del mismo,
se comparan los resultados obtenidos contra los actuales y se identifican las
posibilidades del algoritmo examinado.
Descriptores: IPTV, método de Grupos Adyacentes, retardo de cambio de canal, HG,
IGMP.
Abstract
This pa per anal y ses the ex ist ing de lay within an IPTV sys tem when a user se lects
an other chan nel, and a new al go rithm is used to re duce it. Based on the ad ja cent
groups method, which re duces the time ac qui si tion of a new chan nel plac ing the or -
der not only for that chan nel but also for the ad ja cent chan nels. There are two prin -
ci ples un der coonsideration, one that there ex ists a suf fi cient bandwidht, and the
other, a multicast trans mis sion (Chunglae, 2004). At the end of the pa per, the ob -
tained re sults are com pared against the pres ent ones and the pos si bil i ties of the al -
go rithm are de ter mined.
Key words: IPTV, Ad ja cent Groups method, chan nel zap ping de lay, HG, IGMP.
Introducción
A lo largo de los últimos años, el incremento delancho de banda en las redes de telecomunica-ciones ha posibilitado la adopción, por parte de losproveedores de servicios, del sistema de televisiónIPTV (Internet Protocol Television), que gestiona lainformación de sus programas en un esquema multicast posibilitando al proveedor a no transmitirsu programación de manera ininterrumpida espe-
rando que algún usuario se conecte al sistema, si-no que el contenido únicamente llegue al usuariocuando éste lo solicite. Esta nueva modalidadexige un mayor ancho de banda disponible en elsistema, pero permite, en cambio, ofrecer de ma-nera sencilla y eficiente servicios de televisióndigital de siguiente generación sobre redes de ban- da ancha como: Oferta ilimitada de canales detelevisión digital y música, programación de pa-go por evento, video por demanda, grabación
InvesInves tiga
tiga
cionescionesEstudios eEstudios e
RecientesRecientes
personalizada de video, publicidad interactiva yservicios de información (Muñiz, 2005).
Estas ventajas se ven limitadas; por la nece-sidad de disminuir el retardo que se presentacuando el usuario cambia el canal seleccionado,que puede variar de 2 a 3 seg (Full Service- VDSL,2002), (Cisco Systems, 2006a), a fin de asegurarla calidad de servicio.
La televisión digital tradicional por cable, basa-da en receptores de tipo STB (Set Top Box), tienela capacidad de recibir todos los canales del sis-tema televisivo en forma simultánea, lo que posi-bilita al usuario cambiar de canal sin retardos per-ceptibles. En contraposición, el sistema IPTV per-mite la gestión de flujos de canales individuales ala vez; la selección de otro canal genera un nuevoflujo de información, lo que provoca un retardo enla transmisión de la señal (Muñiz, 2005), (Sie-mens Communications and Juuniper Networks,2006).
En la actualidad, se han presentado variaspropuestas para disminuir el retardo como: la re-ducción en el tiempo de implementación del STB,optimización en el diseño de la red, decodificacióny desencriptación de datos, los cuales representanel mayor porcentaje del retardo (Cisco Systems,2006).
En este artículo se trabaja sólo en el retardo de lared, el cual se presenta únicamente para IPTV, através de la implementación del método de gruposadyacentes.
Arquitectura de IPTV y proceso de cambio del canal
La figura 1 muestra la arquitectura de red y loscomponentes del sistema IPTV. Esta topologíaconsidera un esquema jerárquico. En la parte re-ceptora, la puerta de enlace del usuario HG (HomeGateway) contiene el flujo de todos los STB co-nectados a él; el Multiplexor de acceso a la líneade abonado digital DSLAM (Digital Subscriber LineAccess Multiplexer) concentra, a su vez, el flujo detodos los HG a él directamente conectados y, porúltimo, el LHR (Last Hop Router) concentra el flujode todos los DSLAM’s. En la parte transmisora, elFHR (First Hop Router) contiene el flujo de todoslos canales del sistema IPTV, mientras que la ca-becera del sistema (IPTV headend) es la encargada de distribuir, almacenar y administrar todos loscontenidos multicast del sistema IPTV (Chunglae,2004), (Full Service-VDSL, 2002) y (Cisco Systems,2006a).
218 INGENIERIA Investigación y Tecnología FI-UNAM
Reducción del retardo en el cambio de canal en servicios IPTV
IPTV HEADEND
FHR LHR DSLAM HG
STB
STB
STB
Figura 1. Arquitectura general del sistema IPTV
Para la unión a un flujo multicast, el STB usa elprotocolo de gestión de grupos en Internet IGMP(Internet Group Management Protocol) (Fenner,1997), que se encarga de enviar mensajes de en-trada y abandono de grupo (Join-Leave messages)al ruteador que le gestiona, el HG.
El HG responde a los mensajes de solicitud demembresía (Membership query messages) que elDSLAM le solicita para verificar su estado por me-dio de los mensajes de reporte de membresía(Membership report messages). El HG también uti- liza IGMP, actuando como si fuera él mismo unhost. De esta manera si el canal solicitado en elmensaje de entrada al grupo ya está disponible enel HG, éste simplemente copiará el flujo multicast y lo transmitirá inmediatamente al STB; si no, el pro- ceso anterior se repite para los ruteadores siguien-tes, el DSLAM y el LHR. El LHR debe soportar tanto el IGMP para comunicarse con el DSLAM como elProtocolo Multicast Independiente de Baja Densi-dad (Protocol Independent Multicast Sparse-Mode)PIM-SM (Fenner et al., 2003) para comunicarsecon el FHR. El LHR también envía mensajes PIM-SM al FHR para notificarle que el estado de mem-bresía a grupos multicast ha cambiado, lograndode esta manera que el flujo multicast correspon-diente a un canal se detenga o se retransmita unnuevo flujo.
Método de grupos adyacentes
El retardo en sistemas IPTV debe de entendersecomo “el tiempo transcurrido entre el envío delprimer mensaje de abandono de grupo hasta larecepción del primer paquete de flujo multicast por parte del STB” (Chunglae, 2004), (Full Service-
VDSL, 2002) y (Cisco Systems, 2006a) y una de laspropuestas actuales para reducir su magnitud es la aplicación del método de grupos adyacentes: asu-miendo que el ancho de banda de la red de acceso (esto es, entre el LHR y el HG) es lo suficiente-mente grande como para soportar diversos flujosmulticast de manera simultánea, ante la solicitudpor parte del STB de adquirir un nuevo canal me-diante el envío de un mensaje de entrada al grupo,el HG podría no sólo enviar el mensaje de entradacorrespondiente al grupo de ese canal, sino tam-bién para los grupos de los canales adyacentes(Figura 2).
De esta manera, los flujos multicast pertene-cientes a los canales adyacentes del canal soli-citado previamente por el STB estarán siempredisponibles en el HG; cuando el STB solicite laadquisición de un canal adyacente, el HG podráenviar el tráfico multicast respectivo inmediata-mente, lo que permite reducir considerablementeel retardo en el cambio de canal (Chunglae,2004).
Simulación de la implementación delmétodo de grupos adyacentes
La simulación fue desarrollada en el software Mat-lab y se realizó en base al sistema mostrado en lafigura 1. Los elementos en conjunto representansólo una sección de un sistema para IPTV que daservicio a una gran cantidad de suscriptores. Cuan- do un STB cambie de canal se medirá el retardo en la adquisición de canal (Join latency) de acuerdo ala disponibilidad del canal deseado en los rutea-dores; es decir, si el canal solicitado se encuentradisponible en el HG, el tiempo de adquisición será
Vol.IX No.3 -julio-septiembre- 2008 219
F. Moumtadi, M. Escobar-Argota, R. López-Moreno y S. Landeros-Ayala
Mensaje de entrada (canal Z)
Mensaje de entrada (canal Z-1)
Mensaje de entrada (canal Z)
Mensaje de entrada (canal Z+1)
STB
HOME GATEWAY
Figura 2. Concepto del Método de Grupos Adyacentes
de 50 ms; si el mensaje de entrada al grupo tieneque viajar hasta el DSLAM, el tiempo será de 150ms y si es hasta el LHR o FHR, será de 500 ms o600 ms, respectivamente (Full Service-VDSL,2002) y (Cisco Systems, 2006b), (Figura 3).
El método de grupos adyacentes fue aplicadocon dos canales adyacentes, uno hacia arriba yotro hacia abajo, y se analizó su influencia en eltiempo de cambio de canal que experimentan losusuarios.
Para la simulación se tomó en cuenta que serealizan diez cambios de canal entre los tres STB’sdel sistema. Se eligió un STB al azar para cadacambio. Los cambios de canal se efectuaron dedos formas distintas, cambios hacia canales alea-torios y cambios hacia canales adyacentes.
Se analizaron cuatro escenarios diferentes:
1. Metodología de cambio tradicional con cam-bios hacia canales adyacentes;
2. Metodología de cambio mejorada con cam-bios hacia canales adyacentes;
3. Metodología de cambio tradicional con cam-bios hacia canales aleatorios;
4. Metodología de cambio mejorada con cam-bios hacia canales aleatorios.
Para representar la cantidad total de suscriptoresdel sistema IPTV se añadieron más usuarios alDSLAM, mismos que se cargaron al LHR más unflujo del 75% total de los canales en el LHR paramantener una configuración PIM-SM.
Sobre cada escenario se hicieron variar tanto elnúmero de usuarios como el de canales para ana-lizar la influencia de estos en el tiempo de cambiode canal.
Análisis de resultados
Los resultados se presentan como el promedio delos diez cambios de canal para diez iteraciones delprograma.
La figura 4 ilustra los resultados obtenidos paralos escenarios 1 y 2 tomando en cuenta 100canales y 50 usuarios. Se observa que al aplicar elmétodo de grupos adyacentes, existe una reduc-ción considerable del tiempo de adquisición decanal cuando el usuario cambia a canales adya-centes. Con el método tradicional se obtiene unpromedio de las 10 iteraciones de alrededor de380 ms. El tiempo de retardo con el método degrupos adyacentes se mantiene constante y conun valor de 50 ms, debido a que los canales queson solicitados por los STB’s están siempre dis-ponibles dentro del HG; por lo tanto, el STB ad-quirirá el canal de forma instantánea. La reducción que se alcanzó con el método fue de 330 msaproximadamente.
220 INGENIERIA Investigación y Tecnología FI-UNAM
Reducción del retardo en el cambio de canal en servicios IPTV
Figura 3. Diagrama de Simulación
La figura 5 ilustra los resultados para los esce-narios 3 y 4 para los mismos 100 canales y 50usuarios. Se observa que el retardo se mantieneen un promedio de 380 ms; esta vez, con el mé-todo implementado se obtiene un retardo con unvalor promedio aproximado de 200 ms, lograndouna reducción del tiempo de adquisición cerca de
180 ms. Esta reducción del tiempo no es tanamplia como cuando se cambia a canales adya-centes, debido a que, con la disponibilidad de loscanales adyacentes en el HG, el DSLAM o el LHR,los canales solicitados pueden o no estar dispo-nibles en estos ruteadores.
Vol.IX No.3 -julio-septiembre- 2008 221
F. Moumtadi, M. Escobar-Argota, R. López-Moreno y S. Landeros-Ayala
Metodología de Cambio TradicionalCanales Aleatorios
Metodología de Cambio OptimizadaCanales Aleatorios
Iteracionesa.
Iteracionesb.
1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
600
500
400
300
200
100
0
Tiem
po (
ms)
600
500
400
300
200
100
0
Tiem
po (
ms)
Iteracionesa.
Iteracionesb.
1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
600
500
400
300
200
100
0
Tiem
po (
ms)
600
500
400
300
200
100
0
Tiem
po (
ms)
Metodología de Cambio TradicionalCanales Adyacentes
Metodología de Cambio OptimizadaCanales Adyacentes
Figura 5. Resultados para 100 canales y 50 usuarios; a) Escenario 3; b) Escenario 4
Figura 4. Resultados para 100 canales y 50 usuarios; a) Escenario 1; b) Escenario 2
La tabla 1 presenta los resultados de la simulaciónal variar el número de canales y el número deusuarios.
Cuando aumentamos el número de canales seaprecia un crecimiento en el retardo (Tabla 1),debido a que es menos probable que el canaldeseado esté siendo visto por algún otro usuario,por lo que el canal requerido se encontrará dis-ponible más lejos del usuario que solicita el canal.Por el contrario, el retardo disminuye si decreceel número de canales, ya que es más probableque el canal deseado esté siendo visto por algúnotro usuario, así el canal requerido se encontrará disponible más cerca del usuario que solicite elcanal.
Ahora bien, si en vez de variar el número decanales variamos el número de usuarios, al au-mentar éstos se tiene una disminución del tiempode retardo, a causa de que será más factible que el canal deseado ya esté siendo visto por algún otrousuario del sistema, por lo que el canal se hallarádisponible más cerca del STB que hace la peticiónde adquisición. El retardo aumenta si disminuimosel número de usuarios, ya que es menos probableque el canal requerido se halle más cerca del STBque lo demanda.
Para analizar mejor cómo varía el tiempo de adqui-sición de canal, respecto al número de canales y al número de usuarios con las dos metodologías decambio de canal, se realizaron las gráficas de lasfiguras 6 y 7 cuando los usuarios cambian a ca-nales adyacentes y a canales aleatorios.
La figura 6 muestra las curvas para 25, 50 y100 usuarios haciendo un barrido de canales bajolas condiciones de los escenarios 1 y 2. La di-ferencia entre los resultados obtenidos por ambasmetodologías también se ilustra. Se aprecia que alaumentar el número de canales el retardo au-menta desde 50 ms hasta un valor cercano a los500 ms1 , disminuyendo al aumentar el número de usuarios para la metodología de cambio tradicio-nal. Para la metodología de cambio mejorada elretardo se mantiene constante en 50 ms1 . Paraanalizar el comportamiento de la reducción del tiem-po de adquisición de canal empleando el métodode reducción se obtuvo la curva de la diferenciaentre los resultados adquiridos con el métodotradicional y los adquiridos con el método mejoradopara 25, 50 y 100 usuarios; en esta última gráfica se puede apreciar qué tanto beneficio otorga el método
222 INGENIERIA Investigación y Tecnología FI-UNAM
Reducción del retardo en el cambio de canal en servicios IPTV
Tabla 1. Resultados de la simulación de los 4 escenarios
Usuarios Canales Canales Retardo con Método Tradicional [ms]
Rerardo con Método Mejorado [ms] Reducción [ms]
50 100Adyacentes 380 50 330
Aleatorios 380 200 180
50 200Adyacentes 450 50 400
Aleatorios 450 300 150
50 50Adyacentes 280 50 230
Aleatorios 280 150 130
100 100Adyacentes 300 50 250
Aleatorios 300 170 130
25 100Adyacentes 430 50 380
Aleatorios 430 320 110
1 Hay que recordar que estos valores se constituyen mediante el
promedio de las 10 iteraciones hechas al programa.
de grupos adyacentes, el cual se incrementa con-forme aumenta el número de canales y conformedisminuye el número de usuarios.
La figura 7 muestra las curvas para 25, 50 y100 usuarios haciendo un barrido de canales,ahora para los escenarios 3 y 4. La diferencia entre
los resultados obtenidos por ambas metodologíastambién se ilustra. Se observa también que elretardo crece al aumentar los canales. Al aplicar elmétodo de grupos adyacentes se observa una pe-queña reducción del retardo. Se ilustra la dife-rencia entre los métodos tradicional y mejorado,en donde se puede apreciar el ahorro de tiempo
Vol.IX No.3 -julio-septiembre- 2008 223
F. Moumtadi, M. Escobar-Argota, R. López-Moreno y S. Landeros-Ayala
a)
d) c)
b)
Figura 6. Resultados obtenidos al variar el número de canales para cambios a canales adyacentes: a) 25 usuarios,
b) 50 usuarios, c) 100 usuarios, d) Diferencia entre ambas tecnologías
c) d)
que se adquiere con el método de grupos ad-yacentes, con respecto al método tradicional decambio de canal. Aquí el máximo beneficio no selogra conforme al aumento del número de canales,sino aproximadamente en el punto en el que elnúmero de canales es igual al doble del número deusuarios, cuyo valor es cercano a 150 ms. Esto esporque con pocos canales se obtiene gran dispo-
nibilidad en el DSLAM, tanto para el método tra-dicional como para el mejorado; conforme aumentan los canales la disponibilidad disminuye para los dosmétodos, pero más con el tradicional, de ahí que lacurva aumenta hasta llegar al máximo beneficio. Apartir de este punto, la gráfica decrece debido a quela disponibilidad de canales disminuye, ahora más,con el método de grupos adyacentes.
224 INGENIERIA Investigación y Tecnología FI-UNAM
Reducción del retardo en el cambio de canal en servicios IPTV
c) d)
Figura 7. Resultados obtenidos al variar el número de canales para cambios a canales aleatorios: a) 25 usuarios, a)
50 usuarios, a) 100 usuarios, a) Diferencia entre ambas tecnologías
a) b)
La figura 8 muestra las curvas para 50, 100 y 200canales haciendo un barrido del número deusuarios bajo las condiciones de los escenarios 1 y 2. La diferencia entre los resultados obtenidos porambas metodologías también se ilustra. Obser-vamos, para canales adyacentes, que al aumentarel número de usuarios el retardo disminuye desde500 ms hasta llegar al valor de 150 ms2 tantopara 50, 100 y 200 canales para la metodologíade cambio tradicional. Para la metodología de cam-
bio mejorada, el retardo se mantiene nuevamenteconstante en 50 [ms]. En la curva que muestra ladiferencia entre los resultados obtenidos por los dos métodos, se observa el beneficio logrado al aplicarel método de grupos adyacentes, el cual decrececonforme aumenta el número de usuarios y con-forme disminuye el número de canales.
Vol.IX No.3 -julio-septiembre- 2008 225
F. Moumtadi, M. Escobar-Argota, R. López-Moreno y S. Landeros-Ayala
a) b)
c) d)
Figura 8. Resultados obtenidos al variar el número de usuarios para cambios a canales adyacentes: a) 50 canales,
b) 100 canales, c) 200 canales, d) Diferencia entre ambas tecnologías
2 A este valor tiende el retardo al aumentar los usuarios, debido
a que el incremento lo hacemos directamente en el DSLAM.
La figura 9 muestra las curvas para 50, 100 y 200canales, haciendo un barrido del número de usua-rios ahora para los escenarios 3 y 4. La diferenciaentre los resultados obtenidos por ambas meto-dologías también se ilustra. Cuando los usuarioscambian a canales aleatorios el retardo disminuyeal aumentar el número de usuarios. Cuando el mé-
todo de reducción es aplicado se tiene una pe-queña reducción del tiempo de adquisición. Seobserva nuevamente que el máximo beneficio delmétodo de grupos adyacentes, cuyo valor es cer-cano a 150 ms, se obtiene cuando el número deusuarios es la mitad al número de canales, debidoa los hechos explicados anteriormente.
226 INGENIERIA Investigación y Tecnología FI-UNAM
Reducción del retardo en el cambio de canal en servicios IPTV
a) b)
c) d)
Figura 9. Resultados obtenidos al variar el número de usuarios para cambios a canales aleatorios:a) 50 canales, b) 100 canales, c) 200 canales, d) Diferencia entre ambas tecnologías
Finalmente, la figura 10 muestra un comparativode los cuatro escenarios, primero para una varia-ción de canales y 50 usuarios, después para 100canales variando los usuarios.
Se puede apreciar en ambos casos que con elmétodo tradicional, cambiando a canales adyacen- tes como a aleatorios, se tiene el mismo retardo,ya que el método tradicional trata igual a los ca-nales adyacentes como aleatorios.
Conclusiones
Al implementar el método de grupos adyacentes se obtiene una mejora considerable del retardo si secambia a canales adyacentes; el retardo tendrá unvalor constante igual al tiempo entre la transmisión del Join message y la recepción del primer paquete del grupo multicast, correspondiente al nuevo
canal enviado directamente del HG, por lo que eltiempo de adquisición será casi inmediato sinimportar el número de canales o el de usuarios.
En el caso de cambios a canales aleatorios, alimplementar el método de reducción, se logra unareducción del tiempo de adquisición que, si bienno es constante, se consigue la máxima reducciónde este tiempo cuando el número de canales esigual al doble del número de usuarios; fuera deestos valores el método no ayudaría mucho en lareduc- ción del tiempo de cambio a canalesaleatorios.
El método sólo servirá si el ancho de banda de lared de acceso es suficientemente grande para so-portar diversos flujos multicast, de lo contrario, sim-plemente el método afectaría a la calidad de expe-riencia del usuario en vez de beneficiarla.
Vol.IX No.3 -julio-septiembre- 2008 227
F. Moumtadi, M. Escobar-Argota, R. López-Moreno y S. Landeros-Ayala
100 200 300 400 500 600 700 800 900 10000
100
200
300
400
500
600
Canales
Tie
mp
o[m
s]
Comparacion de los 4 Escenarios para 50 usuarios
Escenario 1
Escenario 2
Escenario 3
Escenario 4
Figura 10. Gráficas comparativas de los cuatro escenarios (continúa...)
El método de grupos adyacentes es un buenmétodo para reducir el tiempo de adquisición, queinvolucra una parte del tiempo de cambio de canal. No obstante, reducir los retardos de la red no essuficiente, sobre todo porque el mayor porcentajedel tiempo de cambio de canal concierne al pro-ceso de decodificación y al diseño e implemen-tación del STB. Estos aspectos merecen conside-raciones especiales y probablemente, mejores di-seños.
Reducir el retardo en el cambio de canal traeconsigo un beneficio directo en la calidad de expe-riencia del usuario, permitiendo a los proveedoresla captación de más suscriptores al sistema y pro-vocando el abaratamiento de las tarifas del servicio.
Adicionalmente, se propone como trabajos afuturo, el análisis estadístico para la obtención delancho de banda utilizado por la red, de acuerdo a
la popularidad de cada canal, al número total decanales y de suscriptores. También se propone laobtención de los tiempos reales del retardo me-diante la simulación del sistema en un software deredes o con una maqueta del modelo para recabarlos tiempos de acuerdo a la utilización del sistemay a la distancia entre los ruteadores multicast.
Referencias
Chunglae C. et al. Improve ment of channel zapping time in IPTV services using the adja cent groupsJoin-Leave method. In: 6th Inter na tional Confer -ence on Advanced Commu ni ca tion Tech nology,2004, Vol. II, pp. 971-975.
Cisco Systems (2006a). Managing delay in IP vi-deo networks, USA. Version 1.0.
Cisco Systems. (2006b). Cisco wire line video/IPTVsolu tion design and imple men ta tion Guide, Re-lease 1.1, USA, pp. 376.
228 INGENIERIA Investigación y Tecnología FI-UNAM
Reducción del retardo en el cambio de canal en servicios IPTV
100 200 300 400 500 600 700 8000
100
200
300
400
500
600Comparacion de los 4 Escenarios para 100 canales
Tie
mp
o[m
s]
Usuarios
Escenario 1Escenario 2
Escenario 3
Escenario 4
Figura 10. Gráficas comparativas de los cuatro escenarios (...continuación)
Full Service-VDSL. FS-VDSL Spec i fi ca tion, part 2,System Archi tec ture Junio 2002. Full Service-VDSL Committee.
Fenner B. et al. RFC 2362: Protocol inde pendentmulticast-Sparse mode (PIM SM): Protocol spe- cification. Internet Engi neering Task Force, Oct2003.
Fenner W. RFC 2236: Internet Group Manage ment Protocol, Version 2. Internet Engi neering TaskForce, Nov 1997.
Muñiz I. Televisión IP: Una experiencia totalmentepersonalizada [en línea]. Centro de Investiga-ción e Innovación en Telecomunicaciones, A.C.[Fecha de consulta Julio 2005]. Disponible en:http://www.cinit.org.mx/articulo.php?idArticulo=34
Siemens Commu ni ca tions and Juniper Networks.High Quality and Resil ient IPTV Multicast Archi -tec ture. Siemens Commu ni ca tions and JuniperNetworks. 2006.
Vol.IX No.3 -julio-septiembre- 2008 229
F. Moumtadi, M. Escobar-Argota, R. López-Moreno y S. Landeros-Ayala
Semblanza de los autores
Fatima Moumtadi. Obtuvo su maestría en sistemas de radiodifusión satelital y su doctorado en televisión en la Facultad de
Radiodifusión y Televisión de la Universidad Técnica de Comunicaciones e Informática de Moscú, Rusia (MTUCI). Se
desarrolló profesionalmente en el área de Radiofrecuencia. Ha publicado artículos en congresos y revistas nacionales e
internacionales. Actualmente es profesora de carrera en el Departamento de Telecomunicaciones en la Facultad de
Ingeniería de la Universidad Nacional Autónoma de México.
Marlene Escobar-Argota. Obtuvo su título de ingeniera de telecomunicaciones en la Facultad de Ingeniería de la Universidad
Nacional Autónoma de México. Actualmente trabaja en la empresa “Syspro Internacional”·
Ricardo López-Moreno. Se título como ingeniero en telecomunicaciones en la Facultad de Ingeniería de la Universidad
Nacional Autónoma de México. A la fecha labora en una empresa que posee y opera redes metropolitanas de fibra óptica
llamada METRORED.
Salvador Landeros-Ayala. Egresó de la Facultad de Ingeniería, UNAM, con el título de ingeniero mecánico electricista en el
área de comunicaciones. Cursó la maestría en ciencias de la ingeniería de telecomunicaciones en la Universidad Penn -
syl vania, Estados Unidos. Posteriormente, obtuvo el grado de doctor en ingeniería eléctrica en la Facultad de Ingeniería,
UNAM. Ha escrito artículos que han sido presentados en congresos y revistas, tanto internacionales como nacionales.
Fue miembro del Comité de Becas de CONACYT, director del Sistema de Satélites Nacionales y jefe de la División de
Ingeniería Eléctrica. Actualmente es jefe de la División de Estudios de Posgrado de la Facultad de Ingeniería, UNAM.
INGENIERÍA Investigación y Tecnología IX. 3. 231-257, 2008(artículo arbitrado)
Single and multi-objective optimization of path placementfor redundant robotic manipulators
Optimización mono-objetivo y multi-objetivo delemplazamiento de trayectorias de robots manipuladores
redundantes
J.A. Pamanes-García 1 , E. Cuan-Durón 1 and S. Zeghloul 2 1 Instituto Tecnológico de la Laguna,
Dept. of Electric and Electronic Engineering, Torreón, Coahuila, México and 2 Université de Poitiers-Faculté des Sciences,
Laboratoire de Mécanique des Solides, CEDEX - FranceE-mails : [email protected], [email protected], [email protected]
(Recibido: febrero de 2007: aceptado: octubre de 2007)
Abstract
Gen eral for mu la tions are pre sented in this pa per to de ter mine the best po si tion and ori -
en ta tion of a de sired path to be fol lowed by a re dun dant ma nip u la tor. Two classes of
prob lem are con sid ered. In the first, a sin gle ma nip u la tor’s in dex of ki ne matic per for -
mance as so ci ated to one path point must be im proved as much as pos si ble. In the sec -
ond case dis tinct in di ces of ki ne matic per for mance, cor re spond ing to dif fer ent points of
the path, are to be op ti mized. Con straints are taken into ac count in or der to guar an tee
the ac ces si bil ity to the whole de sired task. Sev eral case stud ies are pre sented to il lus -
trate the ef fec tive ness of the method for pla nar and spa tial ma nip u la tors.
Key words: Op ti mi za tion, re dun dant ma nip u la tors, path place ment, mo tion plan ning,
ki ne matic per for mances.
Resumen
En este artículo se presentan formulaciones gener ales para determinar la mejor posición
y orientación de una ruta que se desea que recorra el órgano terminal de un ma-
nipulador redundante. Se consideran dos clases de problemas. En el primer caso un
índice de desempeño cinemático, asociado a un solo punto de la trayectoria, debe
mejorarse tanto como sea posible. En el segundo caso se optimizan distintos índices de
desempeño cinemático, correspondientes a diferentes puntos de la ruta deseada. Se
consideran restricciones para garantizar la accesibilidad a toda la ruta deseada. Para
ilustrar la efectividad del método se presentan varios casos de estudio de mani-
puladores planares y espaciales.
Descriptores: Optimización, manipuladores redundantes, colocación de trayectorias,
planificación de movimientos, desempeño cinemático.
I. Intro duc tion
A ro bot ma nip u la tor is ki ne mat i cally re dun dant if ithas more de gree-of-freedom (dof) than the mini-mum re quired for the ac com plish ment of its tasks.
The re dun dancy in creases the abil ity of the ro bot to avoid col li sions as well as sin gu lar or de gen er atedcon fig u ra tions when a task is car ried out. How ever, this class of ma nip u la tors re quires more com plexschemes for mo tion plan ning com pared with non
InvesInves tiga
tiga
cionescionesEstudios eEstudios e
RecientesRecientes
Single and Multi-Objective Opti mi za tion of Path Place ment for Redun dant ...
re dun dant ma nip u la tors. In deed, a re dun dant ma -nip u la tor should move in such a way that theend-effector achieves a de sired main task and therest of the arm si mul ta neously ac com plishes a sec -ond ary task. The sec ond ary task may be de fined as in ter nal mo tions to op ti mize ma nip u la tor’s per for -mances, or to avoid col li sions. The ki ne matic per -for mances can be mea sured in terms of cri te riacho sen by the user, like the manipulability (Yoshi-kawa , 1985) or the con di tion num ber (An geles etal., 1992) of the Jacobian ma trix, which are in ter -est ing in cer tain ap pli ca tions.
The redundancy of manipulators has beensolved in the literature by optimizing locally (Yoshikawa et al., 1989), (Chiu, 1988) or globally(Nenchev, 1996), (Nakamura et al., 1987),(Pamanes et al., 1999) the kinematic or dynamicperformances. In such works it is assumed that the path placement is specified with respect to therobot’s frame. Therefore, the performances of themanipulator obtained by applying these methodsare relative to the assumed path location. Never-theless, in some applications, the user could find asuitable path location to improve as much aspossible the robot’s performances. An automaticturning table or a collaborative manipulator can beused as positioner devices in the robotic work-station to judiciously place the task to the mainrobot.
The subject of the optimal relative robot/pathplacement has been studied in the literature mainly for non-redundant manipulators (Zhou et al.,1997), (Nelson et al., 1987), (Fardanesh et al.,1988), (Pamanes, 1989), (Pamanes et al., 1991), (Reynier et al., 1992), (Abdel-Malek, 2000). Tothe author’s knowledge, only J.S. Hemmerle andF.B. Prinz (Hemerle et al., 1991) considered theproblem of the optimal path placement for redun-dant manipulators; in this study, it is assumed thatthe task is held by a collaborative manipulator (lefthand) moving simultaneously with the main mani-pulator (right hand) which drives the tool. Twocriteria of optimization were simultaneously consi-dered: the joint variables were moved away from
their limit values as much as possible and the jointdisplacements were minimized. In that method,however, constraints were not taken into accountto assure continuous joint trajectories. On theother hand, the case was not studied in which thetask doesn’t move simultaneously with the mainmanipulator; besides, the optimization of kinematic performances on specific zones of the path wasneither investigated. The resolution of both pro-blems becomes interesting in industrial applica-tions.
Two cases of optimal path placement are stu-died in this paper for redundant manipulators. Inthe former (single-objective problem) we formulatea process to compute the path placement whichallows to optimize one index of kinematic per-formance of the manipulator on only one point ofthe desired path. In the second case (multi-objective problem) we compute the path place-ment such that distinct indices of kinematic perfor- mance are optimized on different zones of thepath. Constraints are taken into account in orderto avoid both exceed the joint limits and discon-tinuous joint trajectories.
In the next section some concepts of robotkinematics are evoked which are later applied inour formulations. A solution is presented in thethird section for the single-objective problem andthen, in the fourth part of the paper, the multi-objective problem is studied. The generalization ofour formulations to solve the case of global op-timization is observed in the fifth section. Somecase studies are discussed to illustrate the effec-tiveness of the methods for both planar and spatialmanipulators. The concluding remarks are finallypresented.
II. Prelim i naries
The kinematic function of a robot manipulator isdefined as:
x f(q)= (1)
Vol.IX No.3 -julio-septiembre- 2008 232
where x is the m-dimensional vector of opera-tional coordinates describing the situation of theend-effector in the Cartesian space; q is the n-di-mensional vector of joint variables defining the ins-tantaneous configuration of the manipulator; f isan m-dimensional function (n ³ m).
The inverse kinematic function of a manipulator, if it exists, is given by
q f (x)-1= (2)
The direct velocity function of a robot mani-pulator is obtained by differentiation of equation 1:
& &x J(q)q= (3)
where the dot denotes differentiation with respectto time and J (q) Î ´R m n is the Jacobian matrix ofthe manipulator. When the number n of joint va-riables qi of a manipulator is equal to the number m of operational coordinates xj of the end effector,then the manipulator is called non redundant. Onthe other hand, when n > m the manipulator istermed redundant. In this case the inverse kine-matic function of equation (2) has an infinite num-ber of solutions.
The inverse velocity function of a manipulator isobtained from equation 3 as
& ( ) &q J q x= -1 (4)
If J(q) is singular or n > m then the inverseJ-1(q) does not exists and the linear system ofequation (3) cannot be solved by using equation(4). In such a case the inverse velocity functionmay be expressed as
& & ( )q J x I J J= + -+ + z (5)
where
J + is the pseudo-inverse of J (in order to simplifythe terms in this paper J(q) will be equiv a lent toJ).
z is an arbi trary vector Î R n.
I is the iden tity matrix of dimen sion n´n.
In equation (5), J + &x is the least-norm solutionof equation (3), i.e., it provides a vector with mini-mum Euclidean norm satisfying this Equation. Onthe other hand, (I–J+ J) z represents the projection of z on the null-space of J; this part is called thehomogeneous solution of equation (3); it is referredto as the self-motion of the manipulator and doesnot cause any end-effector motion. In order to use the self-motion to improve configurations, the vec-tor z is chosen as
z q= Ñk h( ) (6)
where
Ñh( )q is the gradient of an index of perfor manceh(q) to be opti mized.
k is a scaling factor of Ñh( )q . It is taken to be posi -tive if h(q) must be maxi mized and nega tive if h(q) is to be mini mized.
Several criteria of kinematic performances formanipulators have been proposed in the literature,which can be considered for the index h(q) inequation (6). Each of such indices evaluates diffe-rent kinematic features of a manipulator, whichmay be interesting depending on the nature of thetask to be carried out. A succinct survey of twoindices of performance is presented below. Suchindices, the manipulability and the condition num-ber of the jacobian matrix, will be applied as criteria of optimization to solve the path placement pro-blems in section VI.
The manipulability index, introduced by Yoshikawa(1985), is defined as
w T= det( )JJ (7)
Vol.IX No.3 -julio-septiembre- 2008 233
J.A. Pamanes-García, E. Cuan-Durón. and S. Zeghloul
234 INGENIERIA Investigación y Tecnología FI-UNAM
Single and Multi-Objective Opti mi za tion of Path Place ment for Redun dant ...
The manipulability is a measure of the ability toarbitrarily change the position or orientation of theend effector.
Thus, its maximization would be appreciated intask zones where relatively large deviations in theprescribed motion of the end-effector are likely.
The condition number of the Jacobian matrix isanother interesting index applied to evaluate theperformances of robotic manipulators (Angeles etal., 1992). Such index can be computed as:
C( ) max
min
J =m
m (8)
where m max is the largest singular value of J and mmin is the smallest singular value of J.
The minimum condition number of a manipu-lator minimizes the error propagation from inputjoint velocities to output end-effector velocities.Thus, it can be used as a local measure of accu-racy of the manipulator’s motions.
III. Optimal path placement forsingle-objective optimization
A. State ment of the problem
The task of a n-dof manipulator is specified by aset of nt m-dimensional vectors of operational coor-dinates of the end-effector in an orthonormal fra-me åt. The manipulator considered is assumed as being redundant (n>m). The nt vectors correspond to a sample of points pi (i = 1, 2, …, nt ) of thedesired path in the task space. The operational coor-dinates are the desired positions and orientationsof the frame ån+1 attached to the end-effector,as showed in figure 1.
A suitable index of performance is thenassigned by the user to one arbitrary path point,say pk , k Î {1,..., nt}, which must be maximizedby the corresponding manipulator’s configurationwhen the task will be accomplished. A law ofmotion is also given which refers to the time theposition of the end effector on the path.
S 0 X o
O o
Z o Y o
X t
S t Y t O t
Z t
p 1
p i
p n t
••
••
••
••
S n+1 X n+1
Y n+1 Z n+1
••
••
••
•• ••
••
O n+1
tri
0rt
0ri
Figure 1. Desired path referred to the frame tå and its place ment in the frame 0å fixed to the robot
On the other hand, the path placement is specifiedby variables regarding the position and orientation of the frame åt with respect to the frame å0 fixed tothe base of the robot. They are the components ofthe placement vector defined as
[ ]0 e r r rtx ty tz
T= , , , , ,a b g (9)
where rtx, rty, rtz, are the orthogonal components ofthe vector of position ort (Figure 1), and a, b, g are the Euler angles Z-Y-X defining the orientation of åt with respect to the frame å0 .
It is desired to obtain the components of theplacement vector 0e of the path, so that the indexof manipulator’s kinematic performance associa-ted to the sample point pk is optimized when thetask is accomplished.
B. Process of solu tion
The single-objective problem is equivalent to a cons-trained non-linear programming problem. The ob-jective function is defined as the index of per-formance hk(qk) assigned to the path point pk. Thenumber of independent variables will be generally6+n: the 6 components of the placement vector0e of the path and, because of the manipulator’sredundancy, the n joint variables of the configu-ration qk which allow to satisfy the desired situa-tion of the end-effector at the path point pk.
To solve the problem, we propose an optimi-zation process in three phases: phase I in whichthe optimal placement vector must be found;phase II addressed to compute the optimal confi-guration on the path point pk for each proposedplacement to be evaluated; and phase III commi-tted to complete the manipulator’s joint trajectories for the whole desired path by using the optimalpath placement obtained in phase I. Notice thatphase II allows to evaluate the objective function of phase I. Such a function in phase I can be defined as
f hk k= ( )q (10)
The general procedure to solve the single-objectiveproblem is schematized in the flow chart of figure2. Details on the three phases concerned are given below.
Phase I
Before obtain the configurations at each pathpoint, the operational coordinates must be referred to frame Ó0. Therefore, when a new placement isproposed in the optimization process, the opera-tional coordinates have to be first updated in phase I by applying the following transformation:
0
i
0t
t
iT T T= (11)
In this equation:
t
iT is the homo ge neous matrix estab lishing the
desired posi tion and orien ta tion of the endeffector on the path point pi referred to frame
tå .
0 Tt is the homo ge neous matrix for the posi tion and
orien ta tion of frame tå referred to frame 0å .
0 Ti is the homo ge neous matrix defining the posi -
tion and orien ta tion of the end effector on the pathpoint pi with respect to frame 0å .
When the given operational coordinates havebeen updated, then the objective function must beevaluated in phase II for the current placement;after the process returns to phase I in order tocheck for the convergence of the method. If theconvergence is attained then the procedure goesto phase III; otherwise, the placement must beimproved by applying a suitable strategy.
Phase II
After updating of the operational coordinates fora path placement proposed in phase I, the redun- dancy must be solved to find the configurations qi (i=1, 2, …. nt) for all the path points. To do that,we assume as secondary task on point pi the
Vol.IX No.3 -julio-septiembre- 2008 235
J.A. Pamanes-García, E. Cuan-Durón. and S. Zeghloul
optimization of the same index of performanceconsidered on pk; i.e., for one path point themanipulator has to achieve the corresponding ope- rational coordinates and also optimize hk(qi). Tofind such configurations the following process iscarried out:
1. Find a configuration qi at each path pointin such a way that Equation (1) is satisfied. Thisconfiguration is obtained by minimization of thefollowing function:
epos i i= -x x ' (12)
where xi is the vector defining the desired situationof the end-effector at point pi , and xi’ is a vector of operational coordinates corresponding to a confi-guration qi’ proposed when minimizing of equation(12). The symbol × denotes the Euclidean norm. If the task is feasible then equation x i = x i’ will besatisfied when the norm of equation (12) is mini-mized. The numeric minimization is carried out byapplying a method of constrained non-linear opti-mization. The independent variables are the jointvariables of qi’. The constraints to be consideredare presented in the next sub-section.
236 INGENIERIA Investigación y Tecnología FI-UNAM
Single and Multi-Objective Opti mi za tion of Path Place ment for Redun dant ...
Phase II
Phase I
Yes
i = k?
Internal motion of manipulator until optimization of hk(qi)
f (0e) = hk(qk)
Not
Propose a path placement
Compute a configuration qi satisfying the desired situation of the end-effector and all the
constraints
Update the sample of operational coordinates by referring them to frame S0
For i = 1, 2, … nt
Improve the placement
Start
Not
Convergence attained for the
current placement ?
End
Yes
Complete the joint trajectories to carry out the whole task from the
optimal path placement
Phase III
Figure 2. Compu ta tional algo rithm for the single-criterion problem
2. When a configuration qi at one path pointhas been found, satisfying both equation (1) and all the constraints, then compute J, J + and, Ñh( )qand optimize for such a configuration the index h(q)by successively obtaining of the homogeneoussolution of equation (3). At each iteration of thisprocess, when a vector &q
i of the homogeneous so-
lution is obtained corresponding to a certain confi-guration qi, an improved configuration qi* may becomputed by
q q qi i i
t* &= + D (13)
where D is a sufficiently small time interval. Notethat, because &q
i is a homogeneous solution, the
improved configuration qi
* will also preserve equa-tion (1). The initial configuration of the optimization process has been determined in step i.
3. For one path-point the optimization of a confi-guration is stopped when Ñh( )q becomes zero.
Phase III
When computing the optimal path placement onlya significant sample of path points is considered inorder to reduce the time of computation engagedin the optimization process. Nevertheless, the de-sired trajectory is a continuous curve which mustbe approximated by a sufficiently large number ofsupplementary points of the path. So, to syn-thesize continuous joint trajectories for the wholetask, when the optimal placement has been foundthe redundancy must be solved for supplementarypath points. This process is the same used to solvethe redundancy in phase II by optimizing the de-sired index of performance hk(q). The number of sup-plementary points is proposed by the user in such a way that a conventional precision be satisfied. Con- tinuous joint trajectories will be obtained as a result of this process because the index to be optimizedis the same for all the considered points.
C. Constraints of the problem
The optimization processes to obtain the path pla-cement and to solve the redundancy must be
constrained in order to obtain realistic solutions.The following constraints are taken into account:
1. Explicit constraints in phase I
Explicit constraints are imposed in phase I on theplacement vector so that solutions are obtainedonly into the available physical space for the taskplacement. Such space may be imposed by apositioner device. The following constraints on thecomponents of the placement vector are considered:
r r rt x l t x t x u( ) ( )0 0 0£ £ (14a)
r r rt y l t y t y u( ) ( )0 0 0£ £ (14b)
r r rt z l t z t z u( ) ( )0 0 0£ £ (14c)
a a a( ) ( )l u£ £ (14d)
b b b( ) ( )l u£ £ (14e)
g g g( ) ( )l u£ £ (14f)
In expressions (14), the indexes l and u denote,respectively, lower and upper bounds of the inde-pendent variables.
2. Implicit constraints in phase I for access to the task
Implicit constraints are also considered in orderto guarantee the efficacy of placements proposedin the optimization process. To assure the accessi-bility to all the sample points on the path thefollowing constraint is introduced:
ti u tt i n£ = 1 2, ,..., (15)
where t i is the reach vector demanded to themanipulator at point pi; the symbol × denotesEuclidean norm. tu is the norm of the maximumreach which the manipulator can provide. Such normdepends on the geometric parameters of the ma-nipulator.
Vol.IX No.3 -julio-septiembre- 2008 237
J.A. Pamanes-García, E. Cuan-Durón. and S. Zeghloul
3. Explicit constraints in phase II for joint limits avoidance
An elemental condition for any feasible configu-ration consists in preserving the joint variables intothe admissible domain of configurations. So, anyconfiguration used for the task should verify thefollowing conditions:
q q q i n j ni
l
ij i
ut
( ) ( ) ,..., ; ,...,£ £ = =1 1 (16)
where:
qij is the i-th joint vari able of the q j manipulator’sconfig u ra tion corre sponding to the j-th task point.
q qi
l
i
u( ) ( ) are the lower and upper limits, respecti-vely, of the i-th joint vari able.
4. Implicit constraints in phase II toguarantee continuous joint trajectories
Implicit constraints are imposed in phase II whichallow to assure the feasibility of the whole joint tra-jectories.
To introduce the considered constraints we re-call here de notion of the aspect of a manipulator.One aspect is defined (Borrel et al., 1986) as acontinuous subset of the manipulator’s joint spacecomposed by configurations which render non-zero all the m-order minors of the jacobian matrix, exceptthose minors being zero everywhere in the jointspace.
Thus, the aspects of a manipulator are subsetsof the joint space separated by hypersurfaceswhose equations are determined by the m-orderminors of the jacobian matrix equalized to zero.
On the other hand, it is known that for non-cus-pidal manipulators (Burdick et al., 1995), (Wenger, 1997), the continuity of joint trajectories corres-ponding to a given task can be guaranteed if themanipulator is constrained to use configurationsremaining in only one aspect of its joint space.
Consequently, to guarantee continuous joint tra-jectories the following conditions must be imposedto manipulator’s configurations which will be usedto accomplish a desired path:
e dkj kj
( )q > 0 (17)
where
dkj( )q is the left hand func tion of the equa tiondefining the j-th hypersurface ( j = 1, 2,..., nhk )which borders the aspect Ak in the joint space; k Î {1, 2, ... , n A}. nhk is the number of suchhypersurfaces. nA is the number of the robot’saspects. Only one aspect will be chosen con-taining all the config u ra tions which allow to achievethe desired task.
ekj is a constant (+1 or –1) depending on thehypersurface and the consid ered aspect Ak.
In section VI we will identify the implicit cons-traints (17) for two manipulators.
VI. Optimal path placement formulti-objec tive optimization
A. State ment of the problem
The task of a n-dof manipulator is specified by a set of nt m-dimensional vectors of operational coordi-nates of the end-effector (n>m) in an orthonormalframe tå . Such operational coordinates give thedesired positions and orientations to be followed by a frame n+å 1 attached to the end-effector, asshowed in figure 1. In that figure a sample ofpoints pi (i = 1, 2, …, nt ) is illustrated corres-ponding to the desired path in the task space.Suitable indexes of performance are then assig-ned by the user to several path points pi. Thus, wewant to compute the path placement vector 0e, so that all the indexes associated to the samplepoints be optimized while the task is being accom- plished. A law of motion is also specified whichrefers to the time and position of the end-effectoron the path.
Single and Multi-Objective Opti mi za tion of Path Place ment for Redun dant ...
Vol.IX No.3 -julio-septiembre- 2008 238
B. Process of solu tion
The multi-objective problem is also a constrainednon-linear programming problem. The objectivefunction should consistently characterize a set ofdissimilar indexes of performance to be optimized.Thus, it is required that the indexes be first nor-malized to eliminate scaling and unity differences;then they can be included in a coherent objectivefunction.
As in the single-objective problem, the inde-pendent variables will be the 6 components of thepath placement vector 0e and, because of themanipulator’s redundancy, the joint variables ofconfigurations qi which allow to satisfy the desiredsituation of the end-effector on the path points pi. To solve the multi-objective problem we propose an optimization process having also three phases. In phase I the optimal placement will be searched;phase II is addressed to compute the optimalconfigurations at the nt path points for each pla-cement to be evaluated; phase III is finally com-mitted to synthesize the manipulator’s jointtrajectories for the whole desired path by using theoptimal path placement obtained in phase I. Notethat phase II allows to evaluate the objectivefunction of phase I. Such a function is definedbelow. The procedure presented here to solve themultiobjective problem is illustrated in the flowchart of Figure 3. Details of the procedure arediscussed in the next paragraphs.
Phase I
The path placement must be searched in thisphase. For each placement proposed here we have to update the operational coordinates; then anevaluation of the placement can be accomplishedin the process of optimization.
The transformation of such coordinates iscarried out by applying equation (11); then theredundancy will be solved in phase II, and theobjective function will be computed based onnormalized indexes of performance. After that the
process returns to Phase I in order to check for theconvergence of the method. If the convergence isattained then the procedure goes to Phase III;otherwise, the placement must be improved byapplying a suitable strategy. The objective functionfor the multi-objective problem as well as thenormalized indexes, are defined below.
A normalized index of performance associatedto the sample point pi is obtained as:
ch
hi
i i
i
=( )
*
q i ntÎ { , ,..., }1 2 (18)
The normalization factor hi
* in equation (18) isthe maximum value of the index of performance atthe point pi that can be obtained by the ma-nipulator when only such index is optimized, andthe accessibility to all the path points is satisfied. In fact, the normalization factor h
i
* is the optimalvalue obtained for the index h
i i( )q in the sin-
gle-objective problem. Thus, to obtain the normali-zation factors we have to solve as much single-objective problems as sample-configurations are to be optimized. It must be observed that a sample-point could hold or not an index of performanceassociated to be optimized; thus, the number ofindexes to be optimized can be lower or equal than nt.
The main idea to define the objective function is that the value of such function, corresponding to apath location, must be equivalent to a typical valueof the set of normalized indices to be optimized.Such typical value can be defined as:
c c c= - $s (19)
where c and $s c are, respectively, the mean and the standard deviation of the set of normalized indexesassociated to the sample points. Hence, the valueof c obtained by equation (19) corresponds to atypically small value of the set of normalized in-dexes of the sample.
If we assume that the all the indexes of per-formance considered in the problem are to be
Vol.IX No.3 -julio-septiembre- 2008 239
J.A. Pamanes-García, E. Cuan-Durón. and S. Zeghloul
maximized, then the global maximization of the setof nt indexes would be obtained by maximization ofc. Nevertheless, algorithms in usual software foroptimization are generally intended to minimize the objective function. Thus, to solve the optimization
problem by minimization, the objective functioncould be defined as – c; therefore, such a functioncan be finally written as:
f cc= -$s (20)
240 INGENIERIA Investigación y Tecnología FI-UNAM
Single and Multi-Objective Opti mi za tion of Path Place ment for Redun dant ...
Phase II
Phase I
Propose a path placement
Update the sample of operational coordinates by referring them to frame S0
Improve the placement
Start
Not Convergence attained for the
current placement?
Yes
End
Synthesize the joint trajectories to carry out the whole task from the
optimal path placement
Phase III
Provide the normalization
factors h*i (qi)
Improve qi by internal motion of manipulator until optimization of
hi(qi)
Compute a configuration qi satisfying the desired situation of the end-effector and all the
constraints
For i = 1, 2, … nt
Compute the normalized index
)(h
)(hc
ii
iii
q
q*
=
cf c -= s)
Yes
An index of performance is associated to
point pi?
Not
Figure 3. Algo rithm for multi-criteria problem
Phase II
The nt optimal configurations satisfying the desiredtask and constraints, which are used to computethe normalized indexes, must be found in phase II.The algorithm to compute such configurations isthe same used in single-objective problem; thisone has been described in section III.
Phase III
The continuous joint trajectories for the whole taskmust be finally synthesized in Phase III for the op-timal path placement. To do that, the redundancyhas to be solved for supplementary path points insuch a way that the optimal configurations ofpoints pi obtained in phase II are preserved.
In the multi-objective problem however, becauseof generally different indexes of performance areassociated to adjacent sample path points, say pi
and pi+1, we cannot use a single index to solve theredundancy by using the homogeneous solution for intermediate path points. In fact, if the homo-geneous solution is applied on intermediate pointsto optimize the index associated to pi, then thejoint trajectories becomes discontinuous on pi+1
and vice versa.
To solve the redundancy and synthesize thecontinuous joint trajectories connecting adjacentsample path points, a judicious strategy must beused. We propose a suitable secondary task to beaccomplished, which is specified in the joint spaceas a continuous trajectory between configurationsasso- ciated to adjacent sample path points. Thissecondary trajectory is such that the determinant of J J T smoothly evolves from its value on point pi tothe value on point pi+1. Consequently, because allthe configurations so obtained belong to only oneaspect, the continuity of joint trajectories will beassured. Thus, to accomplish both the main andthe secondary tasks, we propose to solve the re-dundancy by minimizing the following objectivefunction at each intermediate point pj between two successive sample points pi and pi+1 :
f e e j nj pos j J
*
det int* , , ,...,= + =J
1 2 (21)
where nint is the number of intermediate points tobe considered between two sample points. Thisnumber is chosen by the user so that a con-ventional precision be satisfied. The error of posi-tion of the end-effector, epos j, in equation (21), isdefined like in equation (12) for intermediate points.
On the other hand, we define J J J*j j j
T= , where Jj
is the Jacobian matrix of the manipulator on theintermediate point pj. Then the error of thedeterminant of J*
j in equation (21) is defined as
{ }e absj
J Jdet
* * '* ( )
JJ J= -det det (22)
where:
det J J* is the desired value of the deter mi nant of J*
for the config u ra tion at point pj. Its value isassigned by a cycloidal law [Equa tion (23)]which is defined for the current segment of thepath between two succes sive sample points.Such cycloidal law must smoothly change thedeter mi nant of J* from its value corre spondingto the config u ra tion at point pi, to that one at pi+1 .
det ( ' )*J J is the value of the deter mi nant of J* for
the current config u ra tion in minimization ofequa tion 21.
The desired behavior of the determinant of J* inthe segment between sample points pi and pi+1 isdescribed by the following cycloidal law:
det detJ JJ i
* *= +
(23)
DD D
(' '
det J' i
* pj
i
pj
i
t
Tsen
t
T-
æ
èçç
ö
ø÷÷
é
ëêê
ù
ûúú
1
2
2
p
p
The variables concerned in equation (23) aredefined as follows:
D('
* * *det det detJ J Ji i i
= -+1
Vol.IX No.3 -julio-septiembre- 2008 241
J.A. Pamanes-García, E. Cuan-Durón. and S. Zeghloul
t t tpj pj pi' = -
DT t ti pi pi
= -+1
where tpi, tpj are the values of the time elapsedwhen the end-effector arrives at points pi (sample)and pj (intermediate), respectively.
C. Constraints of the problem
As considered for the single-objective problem, toobtain realistic solutions in solving the multi-ob-jective problem, explicit and implicit constraintsshould also be taken into account. Such cons-traints are identical to those considered in SectionIII C. They were examined in that section.
V. Path placement for global optimization
The path placement problem was studied in sec-tion III for the optimization of manipulator’s per-formance on a certain point of the path by takinginto account a single kinematic criterion. Never-theless, in some tasks the optimization of suchcriterion can be preferred not only on a particularpoint but on every one of points in the path; i.e. aglobal optimization of manipulator’s performancesis desired when the task is carried out. Note thatsuch problem can be considered as a particularcase of the multi-objective problem examined inthe previous section. In fact, in the formulation formulti-objective optimization we can assign the sa-me criterion of performance to all the samplepoints in order to attain the global optimization.However, it must be pointed out that the homo-genization of the corresponding indices is not re-quired in the process of solution; then equation(18) takes the form c h
i i i= ( )q .
Furthermore, after optimizing the set of indexeson the sample points, the continuous trajectoriesof joint variables for the whole path can be syn-thesized by applying only the Phase III of the pro-cess for the single-objective problem. Conse-quently, the minimization of function (21) is not ne-cessary for global optimization.
VI. Case studies
Several case studies are presented in this sectionin which single and multi-objective problems ofoptimal path placement are solved; we considerplanar and spatial paths for each kind of problem.The planar task must be accomplished by a 3R ma- nipulator, and the spatial task should be achievedby a 4R manipulator. In the following sub-section,the geometric parameters of both manipulators will be specified and the implicit constraints of theproblems to hold configurations in an aspect will be identified. Then, in succeeding subsections the pro-blems will be solved.
A. Manip u la tors for the case studies
1. The 3R manipulator
The considered planar manipulator is shown inFigure 4, and its geometric parameters are pre-sented in table 1. These parameters are defined by using the modified Denavit-Hartenberg method(Khalil et al., 1986). A frame
4å is attached atthe tip of the third link in order to use its origin tospecify the linear velocity of the end-effector. Themanipulator’s joint variables are è1, è2 and è3, andits limit values are q
i
l( ) = - °150 and qi
u( ) = °150 , for i = 1, 2, 3 .
242 INGENIERIA Investigación y Tecnología FI-UNAM
Single and Multi-Objective Opti mi za tion of Path Place ment for Redun dant ...
x4
y4
z4
o4
Ó4
x0
z0
y0
Ó0 o0
Figure 4. 3R Manip u lator to be applied for
planar tasks
By considering the velocity vector of O4 referredto the frame 0å as & &, &x [ ]= x y T , the jacobianmatrix of the manipulator is:
J =- + + - + -
+ +
( ) | ( ) |
( )
s s s d s s d s d
c c c1 12 123 12 123 123
1 12 123 d c c d c d|( ) |12 123 123+
é
ëê
ù
ûú
(24)
In this matrix and hereafter we use the followingcompact notation:
cijk i j kº + +cos( )q q q s
ijk i j kº + +sin( )q q q
cij i j
º +cos( )q q sij i j
º +sin( )q q
ci i
º cos( )q si i
º sin( )q
The 2-order minors of the jacobian matrix areexpressed as:
m d s s12
2 23= +( ) ( 25a)
m d s s22
3 23= +( ) (25b)
m d s32
3= (25c)
The conditions of configurations which renderzero the above minors provide the following equa-tions of the surfaces dividing the joint space inaspects:
s s2 23 0+ = (26)
s s3 23 0+ = (27)
s3 0= (28)
Thus, six aspects can be identified (nA=6) forthe 3R manipulator, as showed in figure 5. Wechose the aspect A1 for the achievement of thetask; consequently for (17) we have k=1. Then weobserve that the aspect A1 is surrounded by thesurfaces specified by equations (26) and (28);therefore we have nhk =2 and å11=1, å12=1 forine- quality (17).
The implicit constraints on è2 and è3 to holdconfigurations in the aspect A1 are then expressedas
d11 0> (29)
and
d12 0> (30)
where d11 2 23= +s s and d12 3= s .
Vol.IX No.3 -julio-septiembre- 2008 243
J.A. Pamanes-García, E. Cuan-Durón. and S. Zeghloul
Table 1. Geometric param e ters of the 3R manip u lator
a d q r
1 0 0 q1 0
2 0 d q2 r2
3 0 d q3 r3
4 0 d 0 0
A6
1) q
2
A2
A5
A3
A1
A4
q3
q1
q2
Figure 5. Aspects of the 3R manip u lator
2. The 4R manip u lator
The manipulator is shown in figure 6 and its geo-metric parameters are presented in table 2. Thejoint variables are è1, è2, è3 and è4, and its limitsvalues are q
i
l( ) = - °150 and qi
u( ) = °150 , for i = 1,2, 3, 4. To specify the linear velocity of the endeffector we use the point O5 of the frame
5åwhich is attached at the tip of the fourth link.
By considering the velocity vector of O5 referredto the frame
0å as & [ & &, &]x ,= x y z T , the jacobianmatrix of the 4R manipulator is:
J =
- + +
+ +
é
ë
êêê
- + +( )
( )
(c c c s d
c c c c d
s s2 23 234 1
2 23 234 1
2 23
0
s c d
s s s s d
c c c d
234 1
2 23 234 1
2 23 234
)
( )
( )
- + +
+ +
- +
- +
+
-
-
( )
)
( )
s s c d
s s s d
c c d
s c d
s23 234 1
23 234 1
23 234
234 1
234 1
234
s d
c d
ù
û
úúú
(31)
The 3-order minors of the jacobian matrix whichare non zero everywhere in the joint space are:
m d c c c s s13
2 23 234 3 34= - + + +( )( ) (32a)
m d c c c s s23
2 23 234 4 34= - + + +( )( ) (32b)
m d s c c c33
4 2 23 234= - + +( ) (32c)
The conditions of configurations which renderzero the above minors provide the following equa-tions of the surfaces dividing the joint space inaspects:
c c c2 23 234 0+ + = (33)
s s3 34 0+ = (34)
s s4 34 0+ = (35)
s4 0= (36)
Thus, twelve aspects can be identified (nA=12) forthe 4R manipulator. We chose the aspect A1 forthe achievement of the task; consequently, forinequality (17) we have k=1. Then we observe that the aspect A1 is bounded by the surfaces ofequations (33), (34) and (36); therefore forinequality (17) we have nhk =3 and å11=1, å12=1,å13=1. Thus, the implicit constraints on configu-rations to hold configurations in the aspect A1 are:
d11 0> (37)
d12 0> (38)
d13 0> (39)
where
d d11 2 23 234 12 3 34= + + = +c c c s s,
and
d13 4= s
B. Single-objective prob lems
The tip of the 3R manipulator should complete aparabolic path; whereas in the case of the 4R ma-nipulator, the tool has to describe a helicoidal path. The tasks of both robots are to be accomplished by applying cycloidal laws of motion to the end-
244 INGENIERIA Investigación y Tecnología FI-UNAM
Single and Multi-Objective Opti mi za tion of Path Place ment for Redun dant ...
x0
z0
y0 Ó0
o0
x5
y5
Ó5
z5
o5
Figure 6. 4R Manip u lator to be applied for three
dimen sional tasks
effector during 5 seconds. The Cartesian coordi-nates of the sample-points are referred to theframe åt; they are given in tables 3 and 5. In thetwo cases the path placements must be deter-mined in such a way that the manipulability index is maximized on the point p3 (when t=2.5 s). Theindependent variables of the planar problem arert
ox, rt
oy , and a (rotation about the axis z0 ); in the
case of the 3D path, the additional variable rtoz
must be included. The initial values for such va-riables, as well as the obtained optimal values aregiven in tables 4 and 6. In the same tables theinitial and a the optimal values of the objectivefunctions are presented. The joint trajectoriescorresponding to the optimal placement areobserved in figures 7 and 10. The behaviors of thenormalized manipulability are compared in figures8 and 11. Sequences of configurations of therobots during the accomplishment of the tasks arepresented in figures 9 and 12 for the initial and theoptimal placements.
Vol.IX No.3 -julio-septiembre- 2008 245
J.A. Pamanes-García, E. Cuan-Durón. and S. Zeghloul
Table 3. Coor di nates of the sample path points in tå
Points x (m) y (m)
p1 -0.2785 0.5028
p2 -0.1392 0.3856
p3 0.0000 0.3504
p4 0.1392 0.3970
p5 0.2547 0.4979
Table 4. Inde pendent vari ables and objetive func tion
rt x0
(m)rt y0
(m)a
(degrees)Objetivefunction
Lower Limit -1.0 -1.0 -90 -
Upper Limit 1.0 1.0 90 -
Initial Values 0 0 0 -0.1233
Optimal Values 0.0492 0.2405 -1.93 -0.1723
t (s)
è(D
egre
es)
B1. Para bolic path
Figure 7. History of joint vari ables for the optimal place ment. 3R manip u lator. Single criterion
246 INGENIERIA Investigación y Tecnología FI-UNAM
Single and Multi-Objective Opti mi za tion of Path Place ment for Redun dant ...
t (s)
Optimal value
Figure 8. Normal ized manipulability of the 3R manip u lator for the planar task
t=0 s t=2 s t=2.5 s t=5 s
a) Initial placement:
t=0 s t=5 s t=2 s t=2.5 s
b) Optimal placement:
Figure 9. Simu la tion of the task
Vol.IX No.3 -julio-septiembre- 2008 247
J.A. Pamanes-García, E. Cuan-Durón. and S. Zeghloul
è(D
egre
es)
t (s)
Figure 10. History of joint vari ables for the optimal place ment. 4R manip u lator. Single crite rion.
t (s)
Optimal value
Figure 11. Normal ized manipulability of the 4R manip u lator during the task
Table 5. Coor di nates of the sample path points in tå
Points x (m) y (m) z (m)
p1 0.1500 0.4000 0.0000
p2 0.0464 0.5427 0.0307
p3 -0.1214 0.4882 0.0613
p4 -0.1214 0.3118 0.0920
p5 0.1214 0.3118 0.138
Table 6. Inde pendent vari ables and objetive func tion
rt x0
(m)rt y0
(m)rt z0
(m)
a(degree
s)
Objetivefunction
Lower Limit -1.0 -1.0 -1.0 -180 -
Upper Limit 1.0 1.0 1.0 180 -
Initial Values 0 0 0 0 -0.1559
Optimal Values 0.0681 0.1142 -0.0572 9.91 -0.1639
B2. Helicoidal path
C. Multi-objective prob lems
In the case of the planar task the extremity of the3R manipulator should complete a parabolic path;for the 3D task the 4R manipulator’s tool has todescribe a helicoidal path. In both cases the mo-tion of the end-effector follows a cycloidal law. Theperiods of the tasks are 6 and 5 seconds for the 3R and 4R manipulators, respectively. The Cartesiancoordinates of the sample-points are referred toframe åt, and different indexes of performance areassociated to some points, as indicated in tables 7and 10. In the problems we want to determine thepath placement which allows to optimize the valueof the specified indexes by the related manipu-lator’s configuration when the task is carried out.
The normalization factors used in equation (18)are previously computed by solving the single-objective problem for points having a related indexof performance. The obtained values of such fac-tors are listed in tables 8 and 11. The independent
variables of the planar problem are rtox , rt
oy , and a
(rotation about the axis z0 ); in the case of the 3Dpath, the additional variable rt
oy must be included.
The initial values for such variables, as well as theobtained optimal values are given in tables 9 and12. In the same tables the initial and optimal va-lues of the objective functions are presented. Thejoint trajectories corresponding to the optimalplacement are observed in figures 13 and 18. Theprogress attained of the normalized indices asso-ciated to the sample points can be appreciated infigures 14 and 19. The behaviors of the manipu-lability and the condition number (both normalized) during the task are shown in figures 15, 16, 20and 21. Sequences of configurations of the robotsdescribing the desired paths are presented infigures 17 and 22 for the initial and the optimalplacements.
248 INGENIERIA Investigación y Tecnología FI-UNAM
Single and Multi-Objective Opti mi za tion of Path Place ment for Redun dant ...
a) Initial placement:
b) Optimal placement:
t=5 s t=3 s t=0 s t=2.5 s
t=5 s t=3 s t=0 s t=2.5 s
Figure 12. Simu la tion of the task
Vol.IX No.3 -julio-septiembre- 2008 249
J.A. Pamanes-García, E. Cuan-Durón. and S. Zeghloul
Table 8. Normal iza tion factors and time asso ci ated to
the sample points
PointNormalization
factorValue t (s)
p1 h1* 0.1727 0.0
p3 h3* 1.0841 3.5
p5 h5* 1.0841 5.0
p6 h6* 0.1727 6.0
Table 10. Coor di nates of the sample path points in tå
Point x (m) y (m) z (m)Index of
performance
p1 0.3722 0.1466 0.1126 Manipulability
p2 0.3587 0.1770 0.1375 -
p3 0.0935 0.3889 0.4005Conditionnumber
p4 -0.2330 0.3251 0.6578Conditionnumber
p5 -0.2554 0.3079 0.6790 -
p6 -0.2876 0.2780 0.7120 Manipulability
Table 11. Normal iza tion factors and time asso ci ated to
the sample points
Point Normalization factor Value t(s)
p1 h1* 0.1526 0.0
p3 h3* 1.4104 2.45
p4 h4* 1.4104 3.75
p6 h6* 0.1526 5.0
Table 12. Inde pendent vari ables and objective
rt xo (m) rt y
o (m) rt zo (m) a (degrees) Objective function
Lower Limit -1.0000 -1.0000 -1.0000 -180.0 -
Upper Limit 1.0000 1.0000 1.0000 180.0 -
Initial Values 0.0000 0.0000 0.0000 0.0 -0.3537
Optimal Values 0.0865 0.1233 -0.2438 16.8 -0.6635
Table 9. Inde pendent vari ables and objec tive function
rt x0 rt y
0 a (degrees) Objective function
Lower Limit -1.0000 -1.0000 -90.0 -
Upper Limit 1.0000 1.0000 90.0 -
Initial Values 0.4000 0.1000 30.0 -0.5967
Optimal Values -0.0206 -0.0378 -11.0 -0.8922
Table 7. Coor di nates of the sample path points in tå
Point x (m) y (m)Index of
performance
p1 -0.2785 0.5029 Manipulability
p2 -0.2390 0.4614 -
p3 0.0872 0.3701 Condition number
p4 0.1614 0.4143 -
p5 0.2424 0.4845 Condition number
p6 0.2548 0.4979 Manipulability
1. Para bolic path
2. Helicoidal path
250 INGENIERIA Investigación y Tecnología FI-UNAM
Single and Multi-Objective Opti mi za tion of Path Place ment for Redun dant ...
p1
c
p6 p5 p3 Point
Figure 14. Values of the normal ized indices
è
(Deg
rees
)
t (s)
Figure 13. History of joint vari ables for the optimal place ment. 3R manip u lator. Multi-criteria
Vol.IX No.3 -julio-septiembre- 2008 251
J.A. Pamanes-García, E. Cuan-Durón. and S. Zeghloul
t (s)
Optimal values
Figure 16. Behavior of the normal ized condi tion number during the task
t (s)
Optimal values
Figure 15. Behavior of the normal ized manipulability during the task
C * (J)
W *
252 INGENIERIA Investigación y Tecnología FI-UNAM
Single and Multi-Objective Opti mi za tion of Path Place ment for Redun dant ...
è(D
egre
es)
t (s)
Figure 18. History of joint vari ables for the optimal place ment. 4R manip u lator. Multi-criteria
Figure 17. Simulation of the task
b) Optimal placement:
a) Initial placement:
t=0 s t=3.5 s t=5 s t=6 s
t=0 s t=3.5 s t=5 s t=6 s
Figure 17. Simu la tion of the task
Vol.IX No.3 -julio-septiembre- 2008 253
J.A. Pamanes-García, E. Cuan-Durón. and S. Zeghloul
Optimal values
t (s)
Figure 20. Behavior of the normal ized manipulability during the task
p1 p6 Point
p3 p4
Figure 19. Values of the normal ized indices
254 INGENIERIA Investigación y Tecnología FI-UNAM
Single and Multi-Objective Opti mi za tion of Path Place ment for Redun dant ...
t=5 s
t=0 s
t=3.75 s t=2.45 s
b) Optimal placement:
a) Initial placement:
t=5 s t=0 s t=3.75 s t=2.45 s
Figure 22. Simu la tion of the task
t (s)
Optimal values
Figure 21. Behavior of the normal ized condi tion number during the task
Conclu sion
General formulations were presented in this paperto determine the best position and orientation of apath to be followed by a redundant robotic mani-pulator. Depending on the requirements of theuser, the quality of a placement can be measuredby using either a single criterion or multiple criteriaof manipulator’s performance. Consequently, theproposed formulations are addressed to solve bothsingle and multi-objective optimization problems.In the single-objective problem, one index of per-formance associated to a specific path-point isdefined as the function to be optimized. On theother hand, in the multi-objective problem such afunction is equivalent to a characteristic indexwhich represents the set of normalized indexes tobe optimized. The proposed formulations take intoaccount constraints regarding the accessibility tothe manipulator’s task. Indeed, we introduce cons- traints in order to: a) demarcate an available phy-sical space to locate the task; b) avoid trans-gression of joint limits during the accomplishmentof the task; c) generate continuous joint trajec-tories on the whole task.
The case studies examined here showed thatsignificant improvements of the manipulator’s per-formance can be obtained by applying our approach.In such cases all the constraints were satisfied andconsequently the accessibility to the completetasks was assured. However, in the hypotheticalcase in which a satisfactory solution could not befound by trying with a first mani- pulator’s aspect,then further attempts could be accomplished byusing other manipulator’s aspects to satisfy theaccessibility conditions and improve the mani-pulator’s performance. On the other hand, thesample points considered in the problems werechosen by using a criterion of symmetry; never-theless, both the number of points and the position of such points on the path could have an influenceon the level of the improvement obtained for theindices of performance. Thus, supplementary stu-dies should be carried out to characterize a sui-table criterion to solve both questions. Furthermore,
in future works additional constraints will be takeninto account to avoid collisions of the manipulatorwhen it works in cluttered environments.
Acknowl edg ments
The sub ven tion for co op er a tion be tween re search -ers of the Instituto Tecnológico de la Laguna ofMex ico and the Laboratoire de Mécanique desSolides of France for this work was made pos si bleunder the grant M00 M02 ECOS-CONACyT-ANUIES.On the other hand, a part of the pres ent work wassup ported by the Na tional Coun cil of Sci ence andTechnology –CONACyT– of Mex ico, (grant 31948-A).
Refer ences
Abdel-Malek S. and Nenchev D.N. Local torqueminimization for redun dant manip u la tors: acorrect formu la tion. Robotica, 14:235-239,2000.
Angeles J. and López-Cajún C. Kine matic isotropy and condi tioning index of serial robotic manip u -la tors. Int. J. Robotics Research, 11(6):560-571, 1992.
Aspragathos N.A. and Foussias S.Optimal loca tionof a robot path when consid ering velocity perfor -mance. Robotica, 20:139-147, 2002.
Borrel B. and Liegois A. A study of multiple manip u -lator inverse kine matic solu tion with appli ca -tions to trajec tory plan ning and workspace de-termi na tion. IEEE Proc. of the 1986 Inter-national Confer ence on Robotics and Auto ma -tion, pp. 1180-1185.
Burdick J.W. A clas si fi ca tion of 3R regional manip u -lator singu lar i ties and geom e tries. Mech a nismsand Machine Theory, 30(1):71-89, 1995.
Chiu S.L. Task compat i bility of manip u la tors postu-res. Int J. Robotics Research, 7(5):13-21, 1988.
El Omri J. and Wenger P. How to recog nize simply a non-singular posture changing 3-DOF manip u -lator. Proceed ings of the 7th Inter na tional Con-ference on Advanced Robotics, 1995, pp. 215-222.
Fardanesh B. and Rastegar J. Minimum cycle timeloca tion of task in the workspace of a robot arm.
Vol.IX No.3 -julio-septiembre- 2008 255
J.A. Pamanes-García, E. Cuan-Durón. and S. Zeghloul
IEEE Proc. of the 21st Confer ence on Deci sionand Control, 1988, pp. 2280-2283.
Hemerle J.S. and Prinz F.B. Optimal path place -ment for kine mat i cally redun dant manip u la tors.Proceed ings of the 1991 IEEE Inter na tionalConfer ence on Robotics and Auto ma tion, 1991, pp. 1234-1243.
Hsu D., Latombe J.C. and Sorkin S. Placing a robot manip u lator amid obsta cles for opti mized Exe-cution. IEEE Int. Symp. on Assembly and TaskPlanning, 1999.
Khalil W. and Kleinfinger J.F. A new geometricnota tion for open and closed-loop robots. In:Proceed ings of the IEEE Inter na tional Confe-rence on Robotics and Auto ma tion, 1986, pp.1174-1180.
Klein C.A. and Blaho, B.E. Dexterity measures forthe design and control of kine mat i cally redun -dant manip u la tors. Int. J. Robotics Research, 6(2):72-83, 1987.
Nakamura Y. and Hanafusa H. Optimal redun dancy control of robot manip u la tors. Int. J. RoboticsResearch, 6(1):32-42, 1987.
Ma S. and Nenchev D.N. Local torque minimi-zation for redun dant manip u la tors: a correctformu la tion. Robotica, (14):235-239, 1996.
Nelson B., Pedersen K. and Donath M. Locating assembly tasks in a manip u la tor’s workspace.IEEE Proc. of the Inter na tional Confer ence on Ro-botics and Auto ma tion, 1987, pp. 1367-1372.
Pamanes G. J. A. A crite rion for optimal place mentof robotic manip u la tors. IFAC Proc. of the 6thSymp. on Infor ma tion Control Prob lems inManu fac turing Tech nology, 1989, pp.183-187.
Pamanes G.J.A and Zeghloul S. Optimal place ment of robotic manip u la tors using multiple kine matic criteria. Proceed ings of the 1991 IEEE Inter na -tional Confer ence on Robotics and Auto ma tion,1991, pp. 933-938.
Pamanes G.J.A., Barrón L.A. and Pinedo C. Cons-trained opti mi za tion in redun dancy reso lu tion ofrobotic manip u la tors. Proceed ings of the 10thWorld Congress on Theory of Machines and Me- chanisms, Oulu, Finland, 1999, pp. 1057-1066.
Reynier F., Chedmail P. and Wenger P. Optimalposi tioning of robots: feasi bility of contin uoustrajec to ries among obsta cles. IEEE Int. Conf .on Systems Man. and Cyber netics Proc., 1992.
Wenger P. Design of cuspidal and noncuspidal ma- nipulators. Proceed ings of the IEEE Inter na tional Confer ence on Robotics and Auto ma tion, 1997, pp 2172-2177.
Yoshikawa T. Manipulability of robotics mecha-nisms. Int. J. Robotics Research, 4(2):3-9, 1985.
Yoshikawa T. and Kiriyama S. Four-joint redun -dant wrist mech a nism and its control. Jour-nal of Dynamic System, Measure ment, and Con-trol, 111:200-204, 1989.
Zeghloul S. and Pamanes G.J.A. Multi-criteria pla-cement of robots in constrained envi ron ments.Robotica, 11:105-110, 1993.
Zhou Z.L., Charles C. and Nguyen. Globally opti-mal trajec tory plan ning for redun dant manip u la -tors using state space augmen ta tion method.Journal of Intel li gent and Robotic Systems, Vol.19(1):105-117, 1997.
256 INGENIERIA Investigación y Tecnología FI-UNAM
Single and Multi-Objective Opti mi za tion of Path Place ment for Redun dant ...
Vol.IX No.3 -julio-septiembre- 2008 257
J.A. Pamanes-García, E. Cuan-Durón. and S. Zeghloul
Semblanza de los autores
J. Alfonso Pamanes-García. Was born in Torreon, Mexico, in 1953. He received the B.S. degree from the La Laguna Insti tute
of Tech nology in 1978, the M.S. degree in mechanics in 1984 from the National Poly technic Insti tute of Mexico, and the
Ph.D. degree in mechanics from the Poitiers Univer sity, France, in 1992. He is a professor in mechanics of robots at the
La Laguna Insti tute of Tech nology, Torreon, Mexico. His research inter ests are in modeling and motion plan ning of robots.
Author of more than 50 scien tific papers published in national or inter na tional congress and jour nals. He has been
reviewer of the National Council of Science and Tech nology of Mexico for eval u a tion of national research projects.
Saïd Zeghloul. Received the M.S. degree in mechanics and the Ph.D. degree in robotics from the Univer sity of Poitiers,
France, in 1980 and 1983, respec tively, and the Doctorat d’Etat es sciences physiques degree in 1991. He is a pro-
fessor at the Faculte des Sciences of the Poitiers Univer sity where he teaches robotics. He is leader of the research group
in robotics of the Laboratoire de Mecanique des Solides of Poitiers, where his research inter ests include mobile robot and
manip u lator path planing, mechan ical hand grasp planing.
Enrique Cuan-Durón. Was born in Torreon, Mexico, in 1960. He received the B.S. degree from the La Laguna Insti tute of
Tech nology in 1981, the M.S. degree in computer systems in 1985 from the Insti tute of Tech nology and Supe rior Studies
of Mon- terrey. He develops his Ph.D. thesis at the Poitiers Univer sity, France, with the support of the La Laguna Insti tute
of Tech nology, Torreon, Mexico. His main research inter ests are in motion plan ning and redun dant robots.
INGENIERÍA Investigación y Tecnología IX. 3. 259-269, 2008(artículo arbitrado)
Effect of imperfect knowledge of hazards on the reliabilityof concrete face rockfill dam and breakwater
Efecto del conocimiento imperfecto de peligros sobre laconfiabilidad de presas de enrocamiento con cara de
concreto y rompeolas
D. De León-Escobedo 1 and O. Fuentes-Mariles 2
1 Facultad de Ingeniería, Universidad Autónoma del Estado de México and 2 Instituto de Ingeniería, Universidad Nacional Autónoma de México, México
E-mail: [email protected]
(Recibido: mayo de 2007: aceptado: septiembre de 2007)
Abstract
A for mu la tion to treat ale a tory and epistemic un cer tain ties, in a sep a rate way, on in fra -
struc tures is pro posed and ap plied to a dam and a break wa ter in Mex ico. The pur pose
of that is to de ter mine 2nd or der bounds on the re li abil ity es ti ma tion due to the in com -
plete knowl edge of some de sign pa ram e ters. These bounds pro vide a quan ti ta tive ba -
sis for risk man age ment ac cord ing to the risk-aversion of own ers and op er a tors of the
in fra struc ture. Also, ac cept able val ues of re li abil ity, are as sessed in terms of con se -
quences costs, and an ini tial cost curve for a break wa ter is pre sented, as they may
con trib ute to en hance the de ci sion mak ing pro cess.
The in cor po ra tion of epistemic un cer tainty makes the re li abil ity in dex to be come a ran -
dom vari able and its his to gram is ob tained to es ti mate per cen tiles as a means to mea -
sure a new ad di tional room for de ci sions as com pared to the tra di tion ally used mean
value of the re li abil ity. Con ser va tive de ci sions are il lus trated for de sign and as sess ment
of struc tures like a dam and a break wa ter.
The pro ce dure in volves a dou ble loop of Monte Carlo sim u la tion and rep re sents a ba sis
for the op ti mal de sign and risk man age ment of dams and break wa ters.
Key words: Struc tural re li abil ity, ale a tory and epistemic un cer tainty, fail ure prob a bil ity,
risk man age ment, Monte Carlo sim u la tion.
Abstract
Se propone una formulación para tratar separadamente las incertidumbres aleatoria y
epistémica en obras de infraestructura y se aplica a una presa y un rompeolas. El
propósito de lo ante rior es determinar límites de 2o. orden en la estimación de la
confiabilidad, debido al conocimiento incompleto en algun(os) parámetro(s) de diseño.
Estos límites proveen bases cuantitativas para una administración de riesgos de
acuerdo a la aversión al riesgo de dueños y operadores de infraestructura. También se
evalúan valores aceptables de confiabilidad y se presenta una curva de costo inicial
para un rompeolas, como elementos que pueden contribuir a mejorar el proceso de
toma de decisiones.
La incorporación de incertidumbres epistémicas ocasiona que el índice de confia-
bilidad se convierta en vari able aleatoria y su histograma se obtiene para estimar
percentiles que pueden usarse como medios para medir el espacio nuevo para
InvesInves tiga
tiga
cionescionesEstudios eEstudios e
RecientesRecientes
decisiones como alternativa al uso tradicional del valor medio de la confiabilidad. Se
ilustran decisiones conservadoras para diseño y evaluación de estructuras como una
presa y un rompeolas. El procedimiento implica la realización de un doble ciclo de
simulación de Monte Carlo y representa la base para el diseño óptimo y la adminis-
tración del riesgo en presas y rompeolas.
Descriptores: confiabilidad estructural, incertidumbres aleatoria y epistémica, pro-
babilidad de falla, administración del riesgo, simulación de Monte Carlo.
Introduction
In all the fields of en gi neer ing, plan ning, de sign, in -spec tion or main te nance, the risk ap pears as anev i dence of the de gree of ex po sure that a fa cil ityfaces due to a haz ard ous or ad verse event (Ang,1984).
A quan ti ta tive risk mea sure is usu ally con sid -ered as the prod uct of the prob a bil ity that the haz -ard oc curs, along with its con se quent struc turaldamage or fail ure, and the cost of the con se -quences de rived from those dam ages or fail ure.
This prob a bil ity is a sci en tific way to model, inthe plan ning and de sign pro cess, the un cer tain tiesin her ent to the de mand that the haz ard im posesagainst the struc ture ca pac ity. How ever, es pe ciallyfor nat u ral haz ards, the cal cu lated prob a bil ity de -pends on the pa ram e ters used for the de mand es -ti ma tion. This re quires a pre dic tion ef fort which isnot per fect and, there fore, con tains epistemic un -cer tainty. It is com monly rec og nized that there aretwo sources of un cer tainty: ale a tory (from the nat u -ral or in her ent vari abil ity of the ran dom vari able)and epistemic (from the im per fec tion of an a lyt i caltools, lim ited samplings or ob ser va tions, er rors onre cord ing de vices, etc.) and that the epistemic un -cer tainty is the one that may be re duced up tosome ex tent.
From the above, the cal cu lated prob a bil ity maybe in ter preted as a ran dom vari able as so ci atedwith the epistemic un cer tainty. Sim i larly, the con -se quences of the dam age or fail ure may also bechar ac ter ized through out ale a tory and epistemic
un cer tain ties. The cal cu lated risk may be, there -fore, con sid ered as a ran dom vari able, with a prob -a bil ity den sity func tion, from which spe cific pro-babilities to achieve a tar get risk may be de ter-mined.
For this work, the sep a ra tion be tween ale a toryand epistemic un cer tain ties is con ve nient be causeit makes it pos si ble to gen er ate 2nd or der es ti -mates on the re li abil ity value given that the epis-temic un cer tainty is the one that may be re ducedthrough ad di tional re search or in for ma tion. Thevari abil ity on re li abil ity per mits the in ter pre ta tion ofbounds ac cord ing to a de sired con fi dence level.
For de ci sion mak ing pur poses, the ap pro pri aterisk may then be spec i fied as a par tic u lar per cen tile or con fi dence level; for ex am ple, for risk-aversiveman ag ers, the per cen tiles 90, 95 or 99 may bead e quate. The de ci sion may be ei ther ap plied tode sign or as sess ment. De pending on the de gree of con ser va tism de sired for a de sign, a proper op tionmay be se lected. This provides the owner, or man -ager of an im por tant fa cil ity, a flex i ble way to makede ci sions which are more con sis tent with his par -tic u lar per cep tion of the risk, and his will ing ness totake it, as com pared to the tra di tional use of themean value of the risk or an nual re li abil ity. This ap -proach ap pears to be tuned up with the trend ofthe mod ern phi los o phy of risk man age ment.
A for mu la tion for the sep a rate treat ment of ale -a tory and epistemic un cer tain ties for en gi neer ingstruc tures has been pre vi ously pre sented for in fra -struc ture fa cil i ties where the mean re li abil ity is notenough as a safety mea sure (Ang et al., 2005).
260 INGENIERIA Investigación y Tecnología FI-UNAM
Effect of imper fect knowl edge of hazards on the reli ability of concrete face rockfill ...
Im por tant en gi neer ing works, like dams and break -wa ters, re quire care ful safety es ti ma tions for de -sign and as sess ment pur poses. Struc tural re li abil -ity tech niques con sti tute the proper frame work tomake those es ti ma tions. In the past, sev eral re li -abil ity pro ce dures have been pro posed (Castillo etal., 2004), (Hud son, 1959), (Melby, 1997) and(Nagao et al., 2005). How ever, a sep a rate treat -ment of ale a tory and epistemic un cer tain ties, withits ad van tages, has not been in cluded for damsand break wa ters.
In this work, those ad van tages are ex ploredfrom the point of view of the cal cu la tion of the ef -fect that an im per fect knowl edge of the haz ardshas over the vari abil ity of the an nual struc tural re li -abil ity. Al low ance is made for con ser va tive de ci -sions be cause, in stead of tak ing the mean value ofthe re li abil ity, per cen tiles de ter mined in terms ofcon fi dence lev els may be used for risk-aversive op -er a tors or man ag ers.
In the fu ture, this type of study may con trib uteto en hance the de ci sion mak ing pro cess for own -ers, man ag ers or op er a tors will ing to tai lor and im -ple ment risk man age ment pro grams or con trolscon tain ing a spe cific de gree of over pro tec tion totheir fa cil i ties. Also, the cost-effectiveness of ad -di tional re search may be ap praised to de vise
op ti mal funds al lo ca tion for a cost-effective risk ma-nagement.
Fu tur is tic de signs and safety as sess ments forthis kind of struc tures may re sort on the de scribedpro ce dure to cal i brate pre scribed de grees of overpro tec tion and to be con sis tent with the spe cificrisk man age ment plans con sid ered by own ers andop er a tors.
Formu la tion of annual failure prob a bilityfor a dam
The se lected dam is a rock cur tain with con creteface dam for power gen er a tion and flood con trol. Itwas built be tween 1991 and 1994 and its height is 187 m, one of the world-highest dams.
Fig ure 1 shows the typ i cal cross sec tion of thedam.
In the fol low ing para graphs, an ap pli ca tion ismade of the de sign of the Aguamilpa dam (Ma ren -go, 2005), spe cif i cally the de sign of the cur tainheight against the max i mum flood, where the ale a -tory and epistemic un cer tain ties are treated in asep a rate way. The limit state F is ex pressed interms of the cur tain height, Hc , and the max i mumlevel of flood tran sit, hf .
Vol.IX No.3 -julio-septiembre- 2008 261
D. De León-Escobedo and O. Fuentes-Mariles
Top of dam
h f
H c
Alluvium Transition material
Stone
Figure 1. Cross section of the dam
262 INGENIERIA Investigación y Tecnología FI-UNAM
Effect of imper fect knowl edge of hazards on the reli ability of concrete face rockfill ...
F H hc f= - (1)
where:
h Q b n bf p= + +2 2 4 2 3 73370 0000476 0 776694( . / ) . /. .
Q b n bp ( . / . / ). .- + +00185 0 0850 7047 2 1 511
2 1642 0 002520 999 2 0 71139. .. .b n b+ (2)
Qp = peak flowrate,N = manning rough ness co ef fi cient,B = av er age width of fail ure sur face in the
shunt tun nel, nu mer i cally es ti mated from the peak flowrate and the tun nel ge om e try,
Hc = 37 m.
Equa tion (2) has been used by CFE (ComisiónFed eral de Electricidad, the Mex i can State PowerEn ergy com pany,) ex perts (Ma ren go, 2005) in pre -vi ous works.
As an il lus tra tion, the ale a tory un cer tainty ismod eled on the vari able of the peak flowrate andthe Manning rough ness co ef fi cient (both are as -sumed lognormals) and epistemic un cer tainty iscon sid ered only on the mean value of the peakflowrate (which is also lognormal).
Hy poth e sis and no ta tion:
a. The co ef fi cient of vari a tion d rep re sents the ale a tory un cer tainty.
b. The co ef fi cient of vari a tion D mea sures the epistemic un cer tainty and rep re sents the er ror on the cal cu la tion of the mean value.
c. For sim plic ity, it is as sumed that there is no bias on the cal cu la tion of the means. The for mu la tion may be ex tended to the case where a sys tem atic bias ex ists.
As men tioned above, epistemic un cer tainty iscon sid ered on E Q p[ ] as so ci ated to im per fec tion on
the cal cu la tion of the mean peak flowrate, rep re -sented by D Qp
.
In this work, the co ef fi cient of vari a tion D Qp is
taken as 0.3 as ob tained through a per sonal com -mu ni ca tion (Cano, 2006) for typ i cal peak flowrates in Mex i can dams.
Given that there is no bias on E Q p[ ] and thatthis mean value is as sumed lognormal, due to theepistemic un cer tainty, E Q p[ ] may be rep re sented:
LNE Qp[ ]( , . )1 0 3
From data gath ered by CFE (Ma ren go, 2005),the sta tis tics for Qp and n were com puted
There fore, the ale a tory variabilities on Qp and nmay be rep re sented
LNQp ( , . )9300 0 286
LNn ( . , . )0 0326 0 0326
From the above, the fail ure prob a bil ity or re li -abil ity in dex be come a ran dom vari able, and its cal -cu la tions ac quire the form of a dou ble Monte Carlosim u la tion loop be cause, for each trial of the mean value (epistemic un cer tainty) of Qp, for ex am ple, an ad di tional sim u la tion is re quired due to the ale a tory un cer tainty on Qp.
As a re sult, a his to gram may be drawn for ei therthe fail ure prob a bil ity or the re li abil ity in dex.
The same pro ce dure may be ap plied to theManning co ef fi cient n al though this is not done inthe pres ent work.
Calcu la tion of annual failure prob a bilityfor a dam
From the limit state in equa tion (1), the fail ureprob a bil ity is given by:
P P Ff = <[ ]0 (3)
and the Cor nell´s re li abil ity in dex is
b = - -F 1 ( )Pf (4)
The cal cu la tion pro ce dure to build the an nualreliability in dex his to gram may be out lined as fol lows:
1) Sim u late nt mean val ues of the vari able with epistemic un cer tainty, say E[Qp]
2) For a sim u lated value of E[Qp], a trial of the ran dom vari ables with ale a tory uncer-tainty is per formed, in this case, Qp and n.
3) For each trial on the sim u la tion 2), in ner loop, the limit state func tion F is as sessed.
4) It is counted the num ber of times, nf, when F<0. The ra tio nf/nt rep re sents the fail ure prob a bil ity con di tional to the simu-lated value of E[Qp]. Also, the con di tional re li abil ity in dex is ob tained.
5) The outer sim u la tion loop is per formed by re peat ing the pro cess for all pos si ble mean val ues of Qp ob tain ing a se ries of con di tional re li abil ity in di ces.
The re li abil ity in dex his to gram is built and the ap -pro pri ate per cen tiles are es ti mated.
Fig ure 2 shows the his to gram of the dam re li -abil ity in dex. The val ues marked with the red ar rows are the prob a bil i ties that the dam avail able re li abil -ity value is larger than the tar get (de mand) valuepointed by the ar row. It rep re sents the con fi dencelevel that the dam (avail able) re li abil ity may sat isfythe spec i fied tar get value. For the cases where thetar get is lo cated within the left tail, with a valuesmaller than the mean, the con fi dence that theavail able reliabilities shown un der the his to gramwill meet the tar get value be comes higher. In theclas si cal in ter pre ta tion, the per cen tiles for the avai- lable reliabilities (the val ues pointed by the ar rows)would be 1, 5, 10 and 25%. How ever, the prob a -bil i ties that the avail able reliabilities ex ceed thespec i fied tar get re li abil ity are 99, 95, 90 and 75%,res- pectively.
The in ter pre ta tion of re li abil ity in di ces and theprob a bil i ties in fig ure 2 is as fol lows: the dis tri bu -tion of re li abil ity in di ces mean the vari a tions on there li abil ity due to the epistemic un cer tainty in cluded on the mean peak flowrate. The prob a bil ity that the dam re li abil ity is over any spec i fied tar get is the
Vol.IX No.3 -julio-septiembre- 2008 263
D. De León-Escobedo and O. Fuentes-Mariles
Figure 2. Histo gram of reli ability index for a dam including epistemic uncer tainty on Qp
0
0.1
0.2
0.3
0.4
0.5
2.84 2.88 2.92 2.96 3 3.04 3.08 3.12
b
Re
lati
ve
fre
qu
en
cy
90% 75% Mean
99% 95%
area un der the his to gram from the tar get to theend of the his to gram.
See ta ble 1 for the mean value and the prob a -bil i ties that the dam re li abil ity sat isfy the po ten tialtar gets marked with ar rows in fig ure 2.
Table 1. Mean and percen tiles of b for a dam in Mexico
b
Mean 2.93
75% 2.89
90% 2.87
95% 2.85
99% 2.84
Accept able annual reli ability for bothstruc tures
For sev eral costs of con se quences, Cc, (with out un -cer tain ties in volved), the ac cept able an nual re li -abil ity level may be es ti mated for dams.
The well-known (Sthal, 1986) ac cept able fail ure prob a bil ity is ob tained from the stan dard minimi-zation of the ex pected life-cycle cost:
E C C PVF E C Pt i c f( ] ( ) [ ]= + (5)
where
C C C Pi i f= -0 D ln( ) (6)
and
DCi is the cost to re duce the struc ture fail ure prob a bil ity on the or der of “e” be cause of the nat u ral log scale cho sen to rep re sent the ini tial cost. (In this work it is as sumed to be 23 million pe sos for the dam and 10 mil lion pe sos for the break wa ter), andPVF is the pres ent value fac tor:
PVF rT r= - -[ exp( )] /1 (7)
where
r is the net an nual dis count rate (0.08 in this case), and T is the nom i nal operating life of thestruc ture (200 years for the dam and 1500 yearsfor the break wa ter).
There fore,
E C C C P PVF E C Pt i f c f[ ] ln( ) ( ) [ ]= - +0 D (8)
By ap ply ing the minimization rule to (8):
¶ ¶E C Pt f[ ] / = 0 (9)
the ac cept able (or tar get) an nual fail ure prob a bil ityis ob tained:
P C PVF E Cf i c= D / [ ( [ ])] (10)
and, from (4), the ac cept able or tar get an nual re li -abil ity in dex is cal cu lated.
Fig ure 3 shows the ac cept able re li abil ity in di cesfor sev eral costs of con se quences and for the damand break wa ter.
For the con sid ered dam, if a Cc of 400 mil lionpe sos is con sid ered, the tar get an nual re li abil ity is2.88, whereas the ac tual mean value of the damsre li abil ity is 2.93, ac cord ing to fig ure 2. These val -ues show that there is a rea son able con fi dencelevel that the dam sat is fies the tar get value: i. e.,there is a 90% con fi dence that the dam re li abil ityin dex is at least 2.87 while its mean value is 2.93.
264 INGENIERIA Investigación y Tecnología FI-UNAM
Effect of imper fect knowl edge of hazards on the reli ability of concrete face rockfill ...
There fore, a risk-adverse de ci sion maker would see that the ac tual mean re li abil ity, 2.93, is slightlyover the ac cept able or tar get value, 2.88. In ad di -tion, given that the tar get value 2.88 is lo cated tothe left side of the ac tual mean, there is a con fi -dence greater than 50% that the dam ful fills theac cept able re li abil ity. Actually, the ap prox i matecon fi dence level is 82%. How ever, if the tar get re li -abil ity would have been 2.96, for ex am ple, the de -signer would have only a 23% con fi dence level that the re li abil ity of the dam met the tar get value.
If a higher con fi dence level about the ac cept -able value would be de sired, the dam should bede signed for a higher cur tain such that the wholere li abil ity his to gram could shift to the right and then it could pro duce a larger area to the right side ofthe ac cept able value.
For de sign of fu ture dams, the ac cept able re li -abil ity curve may be used to spec ify the de sired re -li abil ity level, in ad di tion to a pre scribed per cen tileto be ap plied to the his to gram that cor re sponds tothe re li abil ity as sess ment ap pro pri ate to the spe -cific type of dam.
The lat ter cal cu la tions may be fur ther ex tendedto gen er ate op ti mal de sign cri te ria for new dams.
Formu la tion of annual failure prob a bilityfor a break water
In or der to cal cu late the DCi cost for break wa ter, acurve of ini tial cost is de vel oped by as sum ing thatthe limit state that gov erns its de sign is the sta bil ity of the core rock el e ments that pro vide pro tec tion to the break wa ter body against sea waves.
The wave height, H, is con sid ered a ran domvari able and it is as sumed to be lognormal. The fol -low ing sta tis ti cal data are used, as es ti mated forthe Tampico´s break wa ter in Mex ico. Tampico´sbreak wa ter, built in 1895, is a 1 mile length, 10 mwidth struc ture with core pro tec tion el e ments(tetra pods) at its sides. The pur pose of this im por -tant in fra struc ture fa cil ity is to pro vide pro tec tion to the ships en ter ing the Tampico´s port, by re duc ingthe wave´s en ergy.
See fig ure 4 for a typ i cal cross sec tion of thebreak wa ter.
By con sid er ing the sta tis tics of wave height atthe site of the struc ture,
LNH ( , . )5 0 2
Vol.IX No.3 -julio-septiembre- 2008 265
D. De León-Escobedo and O. Fuentes-Mariles
Figure 3. Target reli ability index for several costs of conse quences for the dam and break water
2.4
2.6
2.8
3
3.2
3.4
3.6
100 400 700 1000 1300 1600
Cc (MILLION PESOS)
8
Breakw ater
Dam
Also, epistemic un cer tainty is in cluded into the es -ti ma tion of the mean wave height:
LNE H[ ]( , . )1 0 3
By fol low ing a sim i lar se quence as for the damre li abil ity cal cu la tion, the ini tial cost curve is de vel -oped for sev eral val ues of E[H]. In this case, DCi =10 mil lion pe sos. See fig ure 5.
The limit state con sid ered for the sta bil ity of thecore com po nents of the break wa ter is:
F W Wa= - (11)
where
Wa = ac tual de sign weight and,
from well-known rec om men da tions (Hud son, 1959),(Iribarren, 1931), (US Army, 1977):
W H K S ctgs d s= -g q3 31/ [ ( ) ] (12)
266 INGENIERIA Investigación y Tecnología FI-UNAM
Effect of imper fect knowl edge of hazards on the reli ability of concrete face rockfill ...
Figure 4. Cross section of break water
Figure 5. Initial cost of break water per m. of length
0
5
10
15
20
25
1 2 3 4
b
Ci
(mil
lio
np
es
os
/m)
where
gs = the vol u met ric weight of the core ele-ment, in this case, 2.4 tn/m3,
Kd = sta bil ity con stant = 21.82,q = 45°,Ss = spe cific weight of core el e ment = 2.4,Wa = 32 ton.
Calcu la tion of annual reli ability for abreak water
The his to gram of the break wa ter an nual re li abil ityfol lows the se quence de scribed for dams. See fi-gure 6 and ta ble 2 for the re sults.
Table 2. Mean value and percen tiles for the
break water
b
Mean 3.27
75% 3.19
90% 3.16
95% 3.14
99% 3.12
It is ob served, from fig ure 3, that the break wa ter´san nual ac cept able (tar get) re li abil ity is, for a Cc of1000 mil lion pe sos, about 3.1, which is be low theac tual mean value of the re li abil ity, 3.27. In fact,the con fi dence level that the avail able re li abil ity will meet the de mand value of 3.1 is 99%. As in thecase of the dam, if the ac cept able value wouldhave been 3.32, for ex am ple, the con fi dence levelthat the break wa ter would meet the ac cept ablevalue would be only 31%. Also, it is ob served thatas the tar get re li abil ity value is lower, the con fi -dence level of the break wa ter´s avail able re li abil itygets higher.
Discus sion
The his to grams cal cu lated for both the dam andbreak wa ter make trans par ent and ob jec tive the de -gree of con ser va tism taken about the de ci sion toover de sign them and pro vides a mean to ob jec -tively mea sure this de gree.
Also, the ef fect of the amount of epistemic un -cer tainty con sid ered on the de sign pro cess is sys -tem at i cally re flected on the vari a tion range of there li abil ity in dex.
Vol.IX No.3 -julio-septiembre- 2008 267
D. De León-Escobedo and O. Fuentes-Mariles
Figure 6. Histo gram of annual reli ability index for break water including epistemic uncer tainty on H
0
1
2
3
4
5
6
3.12 3.16 3.2 3.24 3.28 3.32 3.36 3.4 3.44 3.48 3.52 3.56
b
Re
lati
ve
fre
qu
en
cy
90% 75% Mean
99% 95%
For the cases shown, it looks like the struc tureswere de signed with a rea son able con ser va tive mar -gin, from the point of view of per cen tile val ues.More spe cif i cally, the dam re li abil ity shows a mod -er ate ex tra safety mar gin, whereas the break wa termay be con sid ered a very con ser va tive or risk-aversive de sign. Of course, as may be pro posed forthe case of the dam, the re li abil ity of any struc turemay be raised through out struc tural up grad ing.
The for mu la tion may be also used to as sess theeco nomic ef fec tive ness of re search in vest ment in -tended to fur ther re duce the epistemic un cer taintyand en hance the struc tural re li abil ity of the fa cil ity.
Also, op ti mal de sign and main te nance cri te ria of dams and break wa ters may be de vel oped on theba sis of the re la tion ships de scribed. Dam age cri te -ria, fra gil ity curves and ex pected loss func tionsneed to be de tailed in or der to pro vide the nec es -sary el e ments for risk man age ment on the de signstage.
Also, alternative repair or damage mitigationschemes may be weighted, from the viewpoint ofcost-benefit analysis, to generate optimal strategies.
Conclu sions and recom men da tions
The cal cu la tion of the dis tri bu tion of the re li abil ityin dex al lows room for con ser va tive de ci sions of op -er a tors or man ag ers for the dams and break wa ters. Risk-aversion may be ob jec tively and sys tem at i cally in cluded on the de ci sion mak ing pro cess to se lecta de sign safety level for dams and break wa ters.The ap proach may con trib ute to man age the riskac cord ing to the pref er ences and risk per cep tion of owner and op er a tors.
For the an a lyzed cases, the mean re li abil ity ofthe struc tures ex ceeds the tar get value. The damde sign has a mean re li abil ity in dex slightly over theac cept able one (with a con fi dence level of about82%) whereas the break wa ter de sign has a verycon ser va tive ex tra safety mar gin and may be con -sid ered a risk-aversive de sign (with a con fi dence
level of 99%). If such sta tus is de sired for the dam,the re sults may be used to up grade the struc tureand reach a de sired con fi dence level for its re li abil -ity in dex.
The pro ce dure may be adapted, with the cor re -spond ing ex ten sions, to con sider other prob a bil itydis tri bu tions for the ran dom vari ables.
Fur ther de vel op ments, with ad e quate es ti mates of costs of con se quences, may con trib ute to com -plete the risk anal y sis on the dam and break wa terand to sup port the risk man age ment strat egy es -tab lished by the own ers and op er a tors.
Sim i lar for mu la tions may be de rived for op ti malin spec tion and main te nance sched ules, es pe ciallyfor older dams ap proach ing the end of their nom i -nal op er at ing life and for which the owner de siresto ex tend this life.
Acknowl edge ments
Data from the dam and break wa ter were madeavail able from Mex i can In sti tu tions and this sup -port is fully ac knowl edged.
Refer ences
Ang-Alfredo H.S. and Tang W.H. Prob a bility con-cepts in engi neering plan ning and design. Vol.II–Risk, reli ability and deci sions. John Wiley andSons. New York. 1984.
Ang-Alfredo H.S. and De León D. Modeling andanal ysis of uncer tain ties for risk- informed deci -sions in infra struc tures engi neering. Journal ofStruc ture and Infra struc ture Engi neering, 1(1):19-31. 2005.
Cano S. and José F. Proyectos hidroeléctricos en el corto, mediano y largo plazo en México. Confer -ence given on behalf of the Comisión Federal de Electricidad at the Universidad Autónoma delEstado de México, 2006.
Castillo E., Losada A., Mínguez R., Castillo C. andBaquerizo A. Optimal engi neering design methodthat combines safety factors and failure
268 INGENIERIA Investigación y Tecnología FI-UNAM
Effect of imper fect knowl edge of hazards on the reli ability of concrete face rockfill ...
prob a bil i ties: Appli ca tion to rubble-moundbreak wa ters. Journal of Waterway, Port, Coastal and Ocean Engi neering, ASCE. 130(2):77-88.2004.
Hudson R.Y. Design of quarry-stone cover layers for rubber-mound break wa ters. WES ResearchReport 2-2. Vicksburg. 1959.
Iribarren-Cavanilles R. Una fórmula para el cálculode los diques de escollera. Revista de ObrasPúblicas, (1). 1931.
Marengo H. Evaluación de riesgos durante la cons-trucción. Seminario sobre evaluación de riesgos en presas. Academia de Ingeniería de México.Acapulco, Gro., 2005.
Melby I.A. and Mlakar P.F. Re li abil ity as sess mentof break wa ters. Re port A440723 from Army
en gi neer wa ter ways ex per i ment sta tion vicks-burg ms coastal hy drau lics lab. 1997.
Nagao-Takashi, Moriya-Yoichi and Washio,Tomoaki. Opti mi za tion of the target failure prob -a bil i ties for port struc tures. IX ICASP. San Fran -cisco, CA. 2005.
Sthal B. Reli ability engi neering and risk anal ysis.Chapter 5 from Planning and design of fixedoffshore plat forms. Edited by McClelland B. andReifel M.D. Van Nostrand Reinhold Co. NewYork. 1986.
U.S. ARMY Corps of Engi neers. Shore Protec tionManual. Published by Coastal Engi neering Re-search Center, Kingman Building. Fort Belvoir,Virginia. 22060 USA. 1977.
Vol.IX No.3 -julio-septiembre- 2008 269
D. De León-Escobedo and O. Fuentes-Mariles
About the authors
David De León-Escobedo. He is a civil engi neer from the Auton o mous Univer sity of Tamaulipas, obtained his Ph. D. at UC
Irvine in 1996 and is PE in Cali fornia since 1996. He has worked on wind and seismic engi neering and between 1999
and 2005 on the risk-based recom men da tions for marine plat forms and pipe lines for the oil industry. Recently, his
research has been focused on the optimal design and main te nance of struc tures for the elec tric industry and bridges.
Currently, he is the head of the Grad uate depart ment of the Engi neering School of the Auton o mous Univer sity of Mexico
State where he is professor since 2005. He is member of the National Researchers System since 2006 and has
published 8 papers in refereed national and inter na tional jour nals.
Oscar A. Fuentes-Mariles. He was born in Mexico City and made under grad uate and grad uate studies in the engi neering
school of the National Univer sity Auton o mous of Mexico. He is researcher in the Insti tute of Engi neering, UNAM and the
National Center of Disas ters Preven tion. He has been professor and researcher for more than 35 years, mainly on the
topics of compu ta tional hydrau lics, hydrology, marine hydrau lics, and general hydrau lics. He has been collab o rator in
more than 150 research projects and has more than 130 scien tific and tech nical publi ca tions. He has received the prizes
Javier Barros Sierra y Enzo Levi.
INGENIERÍA Investigación y Tecnología IX. 3. 271-277, 2008(artículo arbitrado)
Frame, bit and chip error rate evaluation for a DSSScommunication system
Evaluación de la tasa de errores en bit, chip y tramas paraun sistema de comunicacines DSSS
F.R. Castillo-Soria 1 , D. Pacheco-Bautista 1 y M. Sánchez-Meraz 2
1 Universidad del Istmo, Campus Ixtepec, Oaxaca, México y 2 Departamento de Telecomunicaciones SEPI-ESIME–IPN, Unidad Profesional “Adolfo López Mateos”, México DF
E-mails: [email protected], [email protected]
(Recibido: mayo de 2006; aceptado: junio de 2007)
Abstract
The re la tion be tween chips, bits and frames er ror rates in the Ad di tive White Gaussi an
Noise (AWGN) chan nel for a Di rect Se quence Spread Spec trum (DSSS) sys tem, in Mul ti -
ple Ac cess In ter fer ence (MAI) con di tions is eval u ated. A sim ple er ror-correction code
(ECC ) for the Frame Er ror Rate (FER) eval u a tion is used. 64 bits (chips) Pseudo Noise
(PN) se quences are em ployed for the spread spec trum trans mis sion.
An it er a tive Montecarlo (sto chas tic) sim u la tion is used to eval u ate how many er rors on
chips are in tro duced for chan nel ef fects and how they are re lated to the bit er rors. It can
be ob served how the bit er rors may even tu ally cause a frame er ror, i. e. CODEC or com mu -
ni ca tion er ror. These re sults are use ful for ac a dem ics, en gi neers, or pro fes sion als alike.
Key words: sim u la tion, spread spec trum, mul ti ple ac cess, frame er ror rate.
Resumen
Se presenta la evaluación de la relación que tienen las tasas de chip, bits y tramas
erróneas en un canal con Ruido Blanco Gaussiano Aditivo (RBGA) para un sistema de
comunicaciones de espectro disperso de secuencia directa (DSSS) en Condiciones de
Acceso Múltiple (CAM). La simulación emplea secuencias de Pseudo Ruido (PN) de 64
bits para la transmisión de espectro disperso.
Se utiliza una simulación de montecarlo (estocástica) para evaluar la cantidad de chips
erróneos introducidos por los efectos del canal y cómo éstos se relacionan con los
errores en bits. Se puede observar cómo los bits erróneos pueden causar eventualmente
una trama errónea, es decir, un error en el CODEC o en la comunicación. Estos resul-
tados pueden ser utilizados por académicos, ingenieros o profesionales del área.
Descriptores: simulación, espectro disperso, acceso múltiple, tasa de tramas erróneas.
Introduction
Simulation of communication systems has chan-ged the way we design and implement communi-cation systems.
Currently, there exists a great interest in modelingand simulation of communication systems. Onecan either evaluate a small part of the system, orevaluate general characteristics of different designsituations in order to reduce the high cost of
IngeInge nie
nie
ríaríaEn MéxicoEn México
y en el mundoy en el mundo
system testing and even decrease the human risks. However, the researcher should keep in mind thatsimulation results are reality approaches in the sa-me way that the model would adequately describethe system in question. The bit error rate can beconsidered a fundamental part in design and im-plementation of communication systems.
DSSS systems have been widely accepted inthe commercial world of mobile communications;nonetheless, simulating this kind of system re-quires high signal processes, it is in the best in-terest of the researcher to utilize the fastest pro-cessors at one’s disposal, as well as the adequatesoftware (Harada, et al., 2002). In this paper wepresent a software tool named SisCom, which canbe used to evaluate Bit Error Rate (BER), Chip Error Rate (CER) and Frame Error Rate (FER) in DSSSSystems.
System char ac ter is tics
In the transmitter, information data frame is fedinto a channel encoder, which is a linear block co-de (10, 6). The 10 bits codeword is then expanded for a spread spectrum code, as can be seen infigure 1. Next, the digital data is fed into a BPSKmodulator.
Characteristics for codes in order to be used inCDMA are (Yang, 1998):
1. The cross-correlation should be zero or very small:
R x y x yxyT
i ii
l
( )01
= ==å (1)
where x and y are two sequences or codes.
2. Each sequence in the set has an equal number of 1s and –1s, or the number of 1s differs from the number of –1s by at most 1.
3. The scaled dot product of each code should be equal to 1:
R x x x xxxT
i ii
l
( )01
= ==å (2)
R Nxx ( ) /0 1= (2a)
The SisCom program has two types of codeoptions for generating spread spectrum signals:Walsh codes and Pseudo Noise (PN) sequences.Walsh codes are generated using a 64 orderHadamard matrix (4), whose rows and columnsare mutually orthogonal. The basic Hadamard ma-trix is (Lee, et al., 1998):
H2
0 0
0 1=
é
ëê
ù
ûú (3)
272 INGENIERIA Investigación y Tecnología FI-UNAM
Frame, bit and chip error rate eval u a tion for a DSSS commu ni ca tion system
Figure 1. Transmitter
One can find higher order matrices as follows:
HH H
H HN
N N
N N
2 =é
ëê
ù
ûú (4)
PN Sequences are generated with a MSRG(Modular Shift Register Generator) mechanization,known as Galois configuration. The sequence ge-neration starts with the initial state vector: [ 1 1 1 1 1 1 ].
Figure 2 shows the MSRG mechanization usedto generate PN sequences. Figure 3 shows thecorrelation function of PN sequences used (Lee etal., 1998; Harada et al., 2002).
The output PN sequence is:
PN1 =[0,1,0,1,0,1,1,0,0,1,1,0,1,1,1,0,1,1,0,1,0,0,1,0,0,1,1,1,0,0,0,1,0,1,1,1,1,0,0,1,0,1,0,0,0,1,1,0,0,0,0,1,0,0,0,0,0,1,1,1,1,1,1]. The other62 vectors are delayed versions of the output se-quence. Besides, this sequence has been addedby an extra zero.
Continuous time analysis (for simplification) showsthat the system wideband is mainly controlled byPN sequences as shown in (5), (6) and (7). Thetransmitter output signal c(t) is (Stremler, 1998):
c w(t) Ac t p t tc= ( ) ( )cos (5)
Where
A : Signal amplitudec(t) : Spread signalp(t) : Binary function representing the trans-
mitted datawc : Carrier Frequency
The power spectral density Sch ( )w of the spreadsignal c(t) is:
S T c Tch ch ch( ) sin ( / )w w= 2 2 (6)
where
T ch : Chip time
So that the power spectral density SF( )w of SS-BPSK modulated signal can be described as:
S A T chf w( ) =1
2
2 (7)
{ }sin [( ) / ] sin [( ) / ]c T c Tc ch c ch2 22 2w w w w+ + -
Vol.IX No.3 -julio-septiembre- 2008 273
F.R. Castillo-Soria, D. Pacheco-Bautista y M. Sánchez-Meraz
Figure 2. PN sequences generator
Figure 3. Corre la tion func tion for PN sequences whit inserted zero
In the channel module of the SisCom program, theAWGN model and some other empirical and ma-thematical attenuation models are available; ho-wever, the most important quantity in this simu-lation is the Signal to Noise (S/N) ratio.
Figure 4 illustrates the correlation receiver used. In this block, chips, bits and frames are recovered.After one frame is recovered, the program goesback to the channel where noise and attenuationare added to the data signal in an iterative way.
As shown in figure 4, only one frame is re-covered at the receiver, the other 19 frames areadded only as interferers in the channel for thissimulation.
Simu la tion
A very important characteristic of DSSS systems isthe high noise tolerance. This simulation uses S/Nratios from 0.02 to 0.04 into the channel; it means that the noise amplitude is over 30 times greaterthan the data amplitude. This characteristic is knownas “spread spectrum jamming margin”, which isdirectly proportional to the spread codes longitude. Even though the CER is high, the BER is main-tained low.
When the amount of channel noise causes a biterror, the channel CODEC can offer a bigger link
confidence. However, if more than one bit erroroccurs in one frame, we will have one error in thecommunication system. Therefore error randomnessis a very important characteristic for a good CODEC performance. In this case, “block interleaving” may be included to offer better performance in the caseof burst errors (Proakis, 2000).
Instead of using perfect orthogonal codes, weuse PN sequences with a low correlation. Simu-lation shows how this non-perfect characteristiccauses extra interference in the channel due to the fact that more users are connected. Synchroni-zation facilities and easier electronic implemen-tation justify the employment of PN sequences; the extra interference is in this case the downside ofusing them (Figure 5).
Simulation characteristics:
1) Frames: 10 bits (640 chips)2) CODEC: linear block (10,6)3) Multiple access: PN20-PN40 sequences4) Modu la tion: BPSK5) Channel: AWGN 6) Demod u lator: correlator7) Perfect synchrony Tx-Rx, is assumed
274 INGENIERIA Investigación y Tecnología FI-UNAM
Frame, bit and chip error rate eval u a tion for a DSSS commu ni ca tion system
Figure 4. The receiver
SisCom pro gram was de vel oped in MATLAB and re -quires from 30 min utes to 40 hours for one 10-4
er ror rate sim u la tion run ning in a Pentium 4 CPU,2.8 GHz per sonal com puter. This oc curs be causeten or more of the sta tis ti cal events (er rors) areneeded in or der to guar an tee the re sults sig nif i cance.
Results
Figure 6 illustrates the CODEC performance inmultiple access conditions for 1, 10, and 20 users(blue, red, and black respectively). It is very difficultto compare these results to others. Because thissoftware tool is unique, it is referenced only to un-derlying mathematics.
Figure 7 illustrates the FER (blue), BER (red) andCER (black) relations. FER is higher than BER forvery low rates however, the convenience of using aCODEC is observed for high S/N ratios, where theCODEC takes advantage of random errors on bits;at the same time the CER maintains very higherror rates.
Vol.IX No.3 -julio-septiembre- 2008 275
F.R. Castillo-Soria, D. Pacheco-Bautista y M. Sánchez-Meraz
Figure 5. View of SisCom program
Conclu sions
We studied the behavior and the relation betweenchips, bits, and frames errors in the AWGN channel for a DSSS system in MAI conditions. It can beobserved that low variations in CER, causeimportant variations in FER. Randomness of errors
in the channel is the key for good CODEC per-formance.
Acknowl edg ments
We wish to thank the profes sors M.A. ArashFarzaneh and M.A. William Jurdan Davis III for theirvalu able contri bu tions in revising the englishversion of this paper.
276 INGENIERIA Investigación y Tecnología FI-UNAM
Frame, bit and chip error rate eval u a tion for a DSSS commu ni ca tion system
Figure 6. Frames error rate
Figure 7. Chips, bits and frames error rates
Refer ences
Castillo-Soria F.R. Simulación del canal de comu-nicaciones del sistema de espectro disperso desecuencia directa. Master thesis, Research & Gra-duate Section. Mexico DF. ESIME IPN. 2004.
Harada H. and Prasad R. Simu la tion and soft wareradio for mobile commu ni ca tions. Boston, Lon-don. Artech House. 254 p. 2002.
Proakis J.G. Digital commu ni ca tions. Fourthedition. NY. McGraw Hill. 155 p. 2000.
Lee J.S. and Miller L.E. CDMA Systems engi neering hand book. London. Artech House. 357 p. 1998.
Yang S.C. CDMA RF system engi neering. London.Artech House. 214 p. 1998.
Nakamura S. Numer ical anal ysis and graphic visu -al iza tion with MATLAB. 2nd edition. PrenticeHall, 2001.
Moon T.K. Error correc tion coding, math e mat icalmethods and algo rithms. New Jersey, USA.Wiley & Sons. 132 p. 2005.
Stremler F.G. Introducción a los sistemas de comu- nicación. Mexico. Spanish edition. Addison Wesley.70 p. 1998.
Vol.IX No.3 -julio-septiembre- 2008 277
F.R. Castillo-Soria, D. Pacheco-Bautista y M. Sánchez-Meraz
About the authors
Fran cisco Ruben Castillo-Soria. Received his master of science in tele com mu ni ca tions engi neering from IPN-ESIME,
Research and Grad uate Section in Mexico City, 2004. From 2001 to 2004 he was the tele com mu ni ca tions and
computer science engi neering major director of the Tech no log ical Univer sity of Baja Cali fornia S.C. Campus La Paz in
B.C.S. He has partic i pated in Argen tina, Mexico and also the Acapulco Inter na tional Congress. Since 2005 he has been
research-professor at the Universidad del Istmo, Oaxaca. His current research inter ests include simu la tion of tele com mu -
ni ca tions systems, proto cols and multiple access for future gener a tions of mobile commu ni ca tion systems.
Daniel Pacheco-Bautista. Received the master of science from the National Insti tute of Astro physics, Optics and Elec tronics
in Puebla, Mexico, 2003. Since 2004 he has been professor at Universidad del Istmo, Oaxaca, Mexico. He has
presented his work in many national and inter na tional congresses. His current research includes wire less trans ceivers,
frequency synthe sizer, phase-locking and clock recovery for high-speed data commu ni ca tions and program ming logic
circuits.
Miguel Sánchez-Meraz. Received his master of science from the National Poly technic Insti tute in Mexico. Since 1994 he
has been research–professor at the Supe rior School of Mechanic and Elec tric Engi neering, Research and Grad uate
section IPN. Professor Sanchez has been respon sible for many academic and indus tri ally-founded projects. His current
research inter ests lie in simu la tion, digital signal processing based commu ni ca tions systems and secu rity.