6b adaptable

22
6. Control Adaptable Dr. Mart´ ın Velasco Villa Secci´ on de Mecatr´ onica Abril de 2015

Upload: pako-alb

Post on 17-Dec-2015

268 views

Category:

Documents


0 download

DESCRIPTION

control adapable

TRANSCRIPT

  • 6. Control Adaptable

    Dr. Martn Velasco Villa

    Seccion de Mecatronica

    Abril de 2015

  • Control Adaptable

    I El control adaptable es una forma alternativa de resolver problemas de controlsujetas a incertidumbres en el modelo.

    I En un control adaptable los parametros del controlador varan en el tiempo,basado en un mecanismo que considera las senales del sistema y, por lo tanto, elajuste en los parametros se realiza en lnea.

    Existen dos enfoques principales:

    a). Control adaptable basado en modelo de referencia.

    b). Metodo de autosintonizacion.

    Estos enfoques presentan las siguientes configuraciones generales

  • Basado en modelo de referencia (a. Parametros estimados)

    Basado en autosintonizacion

  • Notese que:f 0; f converge

    a). El hecho que f 0 no implica que f (t) tiene un lmite cuando t .f (t) =

    cos(log t)t 0 cuando t pero f (t) se mantiene oscilando (cada vez

    mas pequeno).

    b). f converge ; f 0.El hecho que f (t) tenga un limite cuando t no implica que f (t) 0

    f (t) = et sin(e2t)

    .

    c). Si f es acotada por abajo y decreciente(f 0) entonces f converge a un limite.

    Bajo que condiciones f converge a cero?

    Lema 1 (Barbalat)

    Si la funcion diferenciable f (t) tiene un lmite (finito) cuando t , y si f esuniformemente continua, entonces f (t) 0 cuando t .

    I Una condicion suficiente para que una funcion diferenciable sea uniformementecontinua es que su derivada sea acotada.

  • Modelo de Referencia

    I En un esquema basado en modelo de referencia, el modelo de referencia provee elvalor deseado de la salida del sistema.

    I La planta tiene una estructura conocida con parametros desconocidos.

    I El modelo de referencia constituye la respuesta ideal del sistema.

    I La ley de adaptacion ajusta los parametros de la ley de control.

    Para ejemplificar este enfoque considere el sistema,

    mx(t) = u(t) (1)

    que representa el movimiento de una masa libre de friccion, donde u (t) es la senal deentrada (fuerza).

  • Suponga que se desea seguir una trayectoria xm generada a partir del modelo dinamico,

    xm + 1xm + 2xm = r (t) , 1,2 > 0, r (t) : entrada (2)

    Idealmente, se pide que la masa m sigua la trayectoria especificada por la entrada r (t)amortiguada a partir de la dinamica (2) (sistema masa-resorte).Si la masa se conoce de manera exacta, la retroalimentacion,

    u = m(xm + 2 x 2x

    ), x = x xm (3)

    consigue el seguimiento del sistema ya que en lazo cerrado se obtiene,

    x + 2 x 2x = 0. (4)Considere ahora que la masa no es conocida exactamente y que se utiliza un valorestimado m tal que m = mm. Entonces la retroalimentacion (3) toma la forma

    u = m(xm + 2 x 2x

    ). (5)

  • En lazo cerrado se obtiene,

    mx = m(xm 2 x 2x

    )= (m+ m)

    (xm 2 x 2x

    ).

    Esto es,

    mx m (xm 2 x 2x) = m (xm 2 x 2x)m(

    x + 2 x + 2x)= m

    (xm 2 x 2x

    )m(

    x + x + x + 2x)= mv

    m ( x + x + ( x + x)) = mv

    entoncesm (s + s) = mv (6)

    dondes = x + x , v = xm 2 x 2x . (7)

  • Considere ahora la ley de adaptacion,

    m = vs (8)como m = mm, se obtiene considerando m = 0,

    m = vs (9)lo cual permite considerar el sistema en lazo cerrado

    ms = ms + mvm = vs. (10)

    Como el sistema tiene un equilibrio en cero, se considera la funcion candidata deLyapunov

    V =1

    2ms2 +

    1

    2m2 (11)

  • Entonces,

    V = mss +1

    m m

    = s (ms + mv) + 1m (vs)

    = ms2

    Como el sistema produce V semidefinida negativa se tiene probada su estabilidad.Para probar que lm st = 0 se utiliza el lema de Barbalat lo cual concluye la prueba.Notese que

    V = 2mss = 2s (ms + mv)= 2m2s2 2smv

    Como V es acotada, V es uniformemente continua y por lo tanto se cumple queV 0; lo que a su vez implica que s 0.Aunque s 0, no es cierto que m 0 por lo tanto m 6= m.Como s = x + x = 0 x = x con lo cual x 0 cuando t lo que produceque x xm.

  • Control adaptable de manipuladores

    Considere el robot manipulador

    D (q) q + C (q, q) q +Bq + g (q) = . (12)

    Las ecuaciones de movimiento son lineales con respecto a los parametros de la matrizde inercia (masas, distancias, momentos de inercia) en el sentido de que existe unafuncion Y (q, q, q) Rnl y un vector R l tal que la acuacion (12) puedeescribirse en la forma,

    = D (q) q + C (q, q) q +Bq + g (q) = Y (q, q, q). (13)

  • I La funcion Y (q, q, q) se conoce como Regresor y es el Vector de parametros.I La dimension del espacio de parametros (el numero de parametros utilizado) no

    es unica.

    I En general un cuerpo rgido es descrito por 10 parametros: La masa total, seisentradas del tensor de inercia y las tres coordenadas del centro de masa.

    I Un robot de n eslabones tiene un maximo de 10n parametros.

    I Como los movimientos de los robots estan restringidos por la configuracion de suseslabones, el numero de parametros necesarios es menor a 10n.

    I Encontrar el numero mnimo de parametros es una tarea compleja.

  • Robot rotacional de 2 grados de libertad

    D (q) q + C (q, q) q + g (q) = (14)

    Equivalentemente,

    [m1l

    2c1+m2

    (l1 + l2c2 + 2l1lc2 cos q2

    )+ I1zz + I2zz m2

    (l2c2 + l1lc2 cos q2

    )+ I2zz

    m2(l2c2 + l1lc2 cos q2

    )+ I2zz m2l2c2 + I2zz

    ]q

    +

    [hq2 h (q1 + q2)hq1 0

    ]q +

    [(m1lc1 +m2l1) g cos q1 +m2glc2 cos (q1 + q2)

    m2lc2g cos (q1 + q2)

    ]=

    [12

    ](15)

    dondeh = m2l1lc2 sin q2.

  • Definiendo entonces,

    1 = m1l2c1 +m2(l21 + l

    2c2

    )+ I1 + I2 (16)

    2 = m2l1lc23 = m2l2c2 + I2.

    Los elementos de la matriz de Inercia toman la forma,

    d11 = 1 + 22 cos q2 (17)

    d12 = d21 = 3 +2 cos q2d22 = 3.

    Los elementos de C (q, q) pueden escribirse en funcion de

    h = 2 sin q2. (18)

    Los terminos gravitacionales son independientes de D (q) por lo que requierenparametros adicionales

    4 = m1lc1 +m2l1, 5 = m2lc2 (19)

    de donde

    g1 = 4g cos q1 +5g cos (q1 + q2) , g2 = 5g cos (q1 + q2) (20)

  • Por lo tanto se obtiene,

    (1 + 22 cos q2) q1 + (3 +2 cos q2) q2 2 sin q2q2q1 2 sin q2 (q1 + q2) q2+4g cos q1 +5g cos (q1 + q2) = 1

    1q1 +2 (2 cos q2q1 + cos q2q2 sin q2q2q1 sin q2 (q1 + q2) q2)+3q2 +4g cos q1 +5g cos (q1 + q2) = 1

    1q1 +2[cos q2 (2q1 + q2) sin q2

    (q22 + 2q1q2

    )]+3q2

    +4g cos q1 +5g cos (q1 + q2) = 1

    por otra parte,

    (3 +2 cos q2) q1 +3q2 +2 sin q2q1q1 +5g cos (q1 + q2) = 2

    2[q1 cos q2 + q21 sin q2

    ]+3 (q2 + q1) +5g cos (q1 + q2) = 2

  • Equivalentemente, definiendo =[

    1 2]T

    ,

    =

    [q1 cos (q2) (2q1 + q2) sin q2

    (q22 + 2q1q2

    )q2 g cos q1 g cos (q1 + q2)

    0 cos (q2) q1 + sin (q2) q21 q1 + q2 0 g cos (q1 + q2)

    ] 12345

    I A partir de los parametros i es posible entonces conocer el valor de

    combinaciones de los parametros originales.

    I Notese que R5 mientras que

    z = [m1,m2,l1, lc1 , lc2,I1, I2]T R7

    I Dependiendo del espacio de parametros elegido, es posible obtener una relacionbiyectiva entre z y . Esto no siempre es necesario para propositos de control.

  • Esquema de control adaptable

    Considere las siguientes definiciones,

    q = q qd (21)qr = qd qs = q qr = q + q

    De acuerdo a la propiedad de linealidad en los parametros de un manipulador, esposible escribir sus ecuaciones de movimiento en la forma,

    D (q) q + C (q, q) q +B (q) q + g (q) = = Y (q, q, q) (22)

    donde Y (q, q, q) es el regresor y es el vector de parametros.

    I Si no se conoce el valor real del vector de parametros, entonces es necesarioutilizar tan solo una aproximacion del valor real, denotada .

    I Como el vector es desconocido, se considera que puede variar en el tiempo,esta variacion puede obtenerse (estimarse) mediante una ley de adaptacion.

  • Teorema 2Sea qr una senal continua, acotada con por lo menos primera y segunda derivadascontinuas y acotadas y considere > 0 en (21). La ley de retroalimentacion,

    = D (q) qr + C (q, q) qr + Bqr + g (q) kv s = Ya kv s (23)con kv > 0 y Ya = Y (qr , qr , qr ) junto con la ley de adaptacion

    = 1Y Ta s (24)con = T > 0, aplicada al sistema (22),

    D (q) q + C (q, q) q +B (q) + g (q) = (25)

    garantizan el seguimiento asintotico de las trayectorias deseadas qd , qd , y el errorparametrico = permanece acotado.

  • Demostracion. Sea qr una senal continua, acotada y considere los cambios de variabledados en (21). La retroalimentacion (23) se reescribe como,

    = Dqr + C qr + Bqr + g kv s = Dqr + Cqr +Bqr + g kv s+(D D) qr + (C C) qr + (B B) qr + (g g )

    = Dqr + Cqr +Bqr + g kv s +Ya ( ) .(26)

    Entonces la dinamica del sistema en lazo cerrado esta dada por,

    D (q) q + C (q, q) q +Bq + g (q) = Dqr + Cqr +Bqr + g kv s +Ya (27)con lo cual,

    D (q) s + C (q, q) s +Bs + kv s = Ya (28)

    D (q) s + C (q, q) s + kBv s = Ya , kBv = B + kv .

  • Para probar el resultado del teorema, considere la funcion candidata de Lyapunov,

    V =1

    2sTD (q) s +

    1

    2 (29)

    con respecto al sistema (28)-(24).Su derivada temporal a lo largo de (28) produce,

    V (t) = sTD (q) s +1

    2sT D (q) s + T

    = sT [C (q, q) s kBv s +Ya ] + 12sT D (q) s sTYaT .

    Considerando que es simetrica,

    V (t) = sT kBv s sT[C 12 D

    ]s

    V (t) = sT kBv s. (30)

    Es claro que el sistema (28) es tan solo estable ya que V es semidefinida negativa.

  • Para probar quelmt s = 0 (31)

    es necesario utilizar el Lema de Barbalat, Entonces se requiere probar que V (t) esuniformemente continua, para lo cual basta demostrar que V (t) es acotada. Entonces

    V (t) = 2sT kBv s= 2sT kBv

    [D1 (C (q, q)) s kBv s +Ya

    ]= 2sT kBvD

    1 [C (q, q) s + kBv s Ya ](32)

    Como V 0, todas las variables anteriores estan al menos acotadas, entonces (31) esvalida.El lema de Barbalat muestra que V 0 y por lo tanto, por continuidad, se tiene ques 0.

  • Notes que cuando s 0, se tiene que q + q 0 lo que produce,q q (33)

    produciendo la convergencia al origen de q, y por lo tanto, el seguimiento detrayectorias buscado.Dado que V 0, la convergencia de s a cero no implica la convergencia de a cero ypor lo tanto permanece acotado en una vecindad del origen. Esto implica que9 y por lo tanto no se logra convergencia parametrica.

  • En la demostracion anterior se ha considerado un sistema formado por el estado [s, ]junto con la funcion de Lyapunov (29).Estrictamente, el sistema en lazo cerrado esta formado por las ecuaciones.

    D (q + qd ) s + c (q + qd , q + qd ) s + kBv s = Ya (34)

    = 1Y Ta sq = q + s

    con lo cual el estado del sistema (34) esta formado por

    [s, , q]

    lo cual implica la modificacion de la funcion de Lyapunov (29), para considerartambien el estado q.Notese que el punto de equilibrio del sistema (34) sigue siendo el origen.