1 eliminación de variables para diagramas de influencia con nodos super valor manuel luque gallego...
TRANSCRIPT
1
Eliminación de Eliminación de variables para variables para diagramas de diagramas de influencia con influencia con
nodos super valornodos super valorManuel Luque GallegoManuel Luque Gallego
Proyecto Elvira IIProyecto Elvira IISan SebastiánSan Sebastián
19-21 de Mayo de 200419-21 de Mayo de 2004
2
ÍndiceÍndice
IntroducciónIntroducción ProblemaProblema Eliminación de variables para DI con Eliminación de variables para DI con
nodos SVnodos SV Ejemplo de evaluaciónEjemplo de evaluación ConclusionesConclusiones Perspectivas futuras y ElviraPerspectivas futuras y Elvira
3
IntroducciónIntroducción
Diagramas de influenciaDiagramas de influencia Comunicación entre analistas de Comunicación entre analistas de
decisiones y expertosdecisiones y expertos Evaluación directaEvaluación directa Representación compacta de la Representación compacta de la
estructura probabilistaestructura probabilista Éxito en ámbitos médicosÉxito en ámbitos médicos
4
IntroducciónIntroducción
Problema médico: Carcinoma pulmonar Problema médico: Carcinoma pulmonar no microcíticono microcítico
5
IntroducciónIntroducción Evaluación de DI:Evaluación de DI:
MEU = MEU = C0C0 max maxD1 D1 C1C1 max maxD2D2 ... max ... maxDnDn CnCn p(C|D)V p(C|D)V
Eliminación Ci: Eliminación Ci: Eliminación Di: maxEliminación Di: max
Secuencia de eliminación legal según <.Secuencia de eliminación legal según <.
SeparabilidadSeparabilidad Aplicar operadores a parte de nuestra función de Aplicar operadores a parte de nuestra función de
valorvalor
Reducción de la dimensionalidad de las operacionesReducción de la dimensionalidad de las operaciones
Aparición en los DI de los nodos Aparición en los DI de los nodos super-valorsuper-valor
6
IntroducciónIntroducción Explotación de la separabilidad de la Explotación de la separabilidad de la
función de utilidad en el problema del función de utilidad en el problema del carcinoma pulmonar no microcíticocarcinoma pulmonar no microcítico
7
Problema planteadoProblema planteado
Posibilidades de evaluaciónPosibilidades de evaluación Opción A: Algoritmos para DI sin nodos SVOpción A: Algoritmos para DI sin nodos SV Opción B: Algoritmo de Tatman y Shachter Opción B: Algoritmo de Tatman y Shachter
para DI con nodos SVpara DI con nodos SV Opción A: (Eliminación de variables para Opción A: (Eliminación de variables para
DI)DI) Ventaja: Eficiencia del algoritmo para DIVentaja: Eficiencia del algoritmo para DI Inconvenientes:Inconvenientes:
Pérdida de la separabilidad de la función de valorPérdida de la separabilidad de la función de valor Determinación de las variables requeridasDeterminación de las variables requeridas
8
Problema planteadoProblema planteado
Inconvenientes de la opción AInconvenientes de la opción A Pérdida de la separabilidad de la función de Pérdida de la separabilidad de la función de
valorvalor Suma (o producto) implícita de los nodos de valorSuma (o producto) implícita de los nodos de valor Potenciales de utilidad de mayor tamañoPotenciales de utilidad de mayor tamaño
9
Problema planteadoProblema planteado
Inconvenientes de la Inconvenientes de la opción Aopción A Determinación de las Determinación de las
variables requeridasvariables requeridas Eliminación según orden Eliminación según orden
total total Eliminar A Eliminar A Eliminación de A une V1 y Eliminación de A une V1 y
V2V2
10
Problema planteadoProblema planteado
Inconvenientes de la opción AInconvenientes de la opción A DI tras la eliminación de A DI tras la eliminación de A Aparecen Aparecen
como requeridas variables que no lo eran como requeridas variables que no lo eran (en este caso B)(en este caso B)
11
Problema planteadoProblema planteado
Opción B: (Algoritmo de Tatman y Opción B: (Algoritmo de Tatman y Shachter)Shachter) Ventaja: Conservación de la separabilidad Ventaja: Conservación de la separabilidad
de la función de valorde la función de valor Inconvenientes:Inconvenientes:
Ineficiencia de la inversión de arcosIneficiencia de la inversión de arcos Pronta destrucción de la estructura de nodos Pronta destrucción de la estructura de nodos
super-valor en algunos casossuper-valor en algunos casos Determinación de las variables requeridasDeterminación de las variables requeridas
12
Problema planteadoProblema planteado
Inconvenientes de la opción BInconvenientes de la opción B Ineficiencia de la inversión de arcosIneficiencia de la inversión de arcos
13
Problema planteadoProblema planteado
Inconvenientes de Inconvenientes de la opción Bla opción B Pronta destrucción Pronta destrucción
de la estructura de de la estructura de nodos super-valornodos super-valor
14
Problema planteadoProblema planteado
Inconvenientes de Inconvenientes de la opción Bla opción B Tras eliminar A y Tras eliminar A y
proceder a eliminar proceder a eliminar D ésta requerirá B, D ésta requerirá B, cuando no deberíacuando no debería
15
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
ObjetivosObjetivos Eliminar la necesidad de invertir arcosEliminar la necesidad de invertir arcos Mantener el máximo tiempo posible la Mantener el máximo tiempo posible la
separabilidad de la función de valorseparabilidad de la función de valor Mejora en la determinación de las Mejora en la determinación de las
variables requeridasvariables requeridas Potenciales de utilidad de menor tamañoPotenciales de utilidad de menor tamaño Mejora en la explicación del razonamientoMejora en la explicación del razonamiento
16
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
Planteamiento del problema: EvaluaciónPlanteamiento del problema: Evaluación
MEU = MEU = C0C0 max maxD1 D1 C1C1 max maxD2D2 ... max ... maxDnDn CnCn p(C|D)V p(C|D)V
Eliminación Ci: Eliminación Ci: Eliminación Di: maxEliminación Di: max Secuencia de eliminación legal según <.Secuencia de eliminación legal según <.
Matriz: Matriz: p(C|D)Vp(C|D)V
V puede presentar + y * anidadosV puede presentar + y * anidados
17
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
EjemploEjemplo MEU = MEU = BB max maxD D AA ΦΦ11(A) (A) ΦΦ22(B) (U(B) (U11(A)+(A)+
(U(U22(A, D)*U(A, D)*U33(B)))(B)))
Matriz: Matriz: ΦΦ11(A) (A) ΦΦ22(B) (U(B) (U11(A)+(U(A)+(U22(A, (A,
D)*UD)*U33(B)))(B)))
Eliminar AEliminar A Sacar factor común Sacar factor común ΦΦ22(B)(B)
Dificultad de análisis con esta Dificultad de análisis con esta
representaciónrepresentación
Representación unívoca de la Representación unívoca de la
matriz a través de un árbolmatriz a través de un árbol
18
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
Representación en árbolRepresentación en árbol Dos tipos de nodos en el árbolDos tipos de nodos en el árbol
Operandos: Potenciales de probabilidad y de Operandos: Potenciales de probabilidad y de utilidadutilidad
Operadores: + y *Operadores: + y * La raíz del árbol inicial siempre es un *La raíz del árbol inicial siempre es un *
Hijos de la raíz son los potenciales de Hijos de la raíz son los potenciales de probabilidad y la estructura de nodos de valorprobabilidad y la estructura de nodos de valor
19
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
EvaluaciónEvaluación Eliminación de variables se traduce en Eliminación de variables se traduce en
transformaciones sobre el árboltransformaciones sobre el árbol Dificultad:Dificultad:
Estudio de las transformaciones lícitas a Estudio de las transformaciones lícitas a realizar sobre el árbolrealizar sobre el árbol
Estudio de la aplicación de los operadores Estudio de la aplicación de los operadores AA y y maxmaxDD al árbol al árbol
20
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
Operaciones lícitas Operaciones lícitas a realizar sobre el a realizar sobre el árbolárbol Operaciones de Operaciones de
compactacióncompactación Secuencia de Secuencia de
operadores del operadores del mismo tipomismo tipo
21
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
Operaciones lícitas a Operaciones lícitas a realizar sobre el realizar sobre el árbolárbol Operaciones de Operaciones de
compactacióncompactación Reducción de nodos Reducción de nodos
operadores con hijos operadores con hijos operandos hojaoperandos hoja
22
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
Operaciones lícitas a Operaciones lícitas a realizar sobre el realizar sobre el árbolárbol Aplicación de la Aplicación de la
propiedad distributivapropiedad distributiva Son Son
transformaciones de transformaciones de equivalencia equivalencia aplicables en aplicables en cualquier subárbolcualquier subárbol
23
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
Eliminación de A Eliminación de A aleatoriaaleatoria Comportamiento de Comportamiento de
AAcon el +con el +
AA [ [ΦΦ1 1 + + ΦΦ22]=]=
AA ΦΦ1 1 + + AA ΦΦ22
La aplicación del La aplicación del operador operador AA a un a un árbol + supone árbol + supone aplicarlo a cada uno aplicarlo a cada uno de sus hijosde sus hijos
24
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
Eliminación de A Eliminación de A aleatoriaaleatoria Aplicación del operador Aplicación del operador
A A a los potenciales hoja a los potenciales hoja Marginalizar el Marginalizar el potencial en Apotencial en A
Comportamiento de Comportamiento de
AAcon el *, si con el *, si ΦΦ11 no no
depende de A y depende de A y ΦΦ22 sí sí
depende de A depende de A
AA [ [ΦΦ1 1 * * ΦΦ22] = ] = ΦΦ1 1
AA ΦΦ22
25
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
Problema de la eliminación de A aleatoria Problema de la eliminación de A aleatoria con el *con el * Necesidad de que sólo una rama del * Necesidad de que sólo una rama del *
dependa de A para poder aplicar dependa de A para poder aplicar recursivamente el operador recursivamente el operador AA
26
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
Resolución del problema de la eliminación de A aleatoria Resolución del problema de la eliminación de A aleatoria con el *con el * Suposición de árbol factorizado Suposición de árbol factorizado Hijos de * son + o bien Hijos de * son + o bien
potenciales hoja gracias a la aplicacación de las propiedades de potenciales hoja gracias a la aplicacación de las propiedades de compactacióncompactación
Objetivo: Reducción del número de ramas dependientes de A en Objetivo: Reducción del número de ramas dependientes de A en los *los *
Reducción del número de ramas dependientes de A a través de la Reducción del número de ramas dependientes de A a través de la compactación de potenciales hoja hijos de * dependientes de A compactación de potenciales hoja hijos de * dependientes de A
27
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
Resolución del problema de la eliminación Resolución del problema de la eliminación de A aleatoria con el *de A aleatoria con el * Reducción del número de ramas dependientes Reducción del número de ramas dependientes
de A a través de la aplicación de la propiedad de A a través de la aplicación de la propiedad distributiva entre ellasdistributiva entre ellas
28
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
Árbol obtenido tras aplicar la propiedad Árbol obtenido tras aplicar la propiedad distributivadistributiva
29
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
Propiedad distributiva en la resolución del Propiedad distributiva en la resolución del problema de la eliminación de A aleatoria problema de la eliminación de A aleatoria con el *con el * Decidir qué * distribuir y respecto a qué dos Decidir qué * distribuir y respecto a qué dos
ramasramas Optimizaciones:Optimizaciones:
Distribuir siempre los * de mayor profundidad en el Distribuir siempre los * de mayor profundidad en el árbolárbol
Realizar todas las compactaciones posibles antes de Realizar todas las compactaciones posibles antes de distribuir y tras distribuirdistribuir y tras distribuir
Justificación de las optimizaciones:Justificación de las optimizaciones: Son cálculos que aunque se pospongan siempre habrá Son cálculos que aunque se pospongan siempre habrá
que realizarlosque realizarlos Posponerlos puede llevar a tener que repetirlos en Posponerlos puede llevar a tener que repetirlos en
varias partes del árbolvarias partes del árbol
30
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
Ejemplo de por qué no se ha de Ejemplo de por qué no se ha de posponer la compactaciónposponer la compactación Desarrollamos sólo un sumando en Desarrollamos sólo un sumando en
producto de sumas para preservar al producto de sumas para preservar al máximo la estructuramáximo la estructura
31
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
Ejemplo tras aplicar distributivaEjemplo tras aplicar distributiva
32
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
Eliminación de D decisiónEliminación de D decisión Aplicación del operador maxAplicación del operador maxDD a los potenciales hoja a los potenciales hoja
Marginalizar el potencial en D Marginalizar el potencial en D Comportamiento del maxComportamiento del maxDD con un operador (+ ó *) : con un operador (+ ó *) :
maxmaxDD[[ΦΦ11op op ΦΦ22]= ]= ΦΦ1 1 op maxop maxDDΦΦ22
si si ΦΦ11 no depende de A y no depende de A y ΦΦ22 sí depende de Así depende de A
Sólo se puede aplicar recursivamente el operador Sólo se puede aplicar recursivamente el operador
maxmaxDD si hay una sola rama dependiente de Dsi hay una sola rama dependiente de D
Unir todas las ramas dependientes de D en una sola, Unir todas las ramas dependientes de D en una sola, reducirla en un potencial hoja y aplicar el operador reducirla en un potencial hoja y aplicar el operador
maxmaxDD
33
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
Ejemplo de eliminación de decisión (I)Ejemplo de eliminación de decisión (I)
34
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
Ejemplo de eliminación de decisión (II)Ejemplo de eliminación de decisión (II)
35
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
Ejemplo de eliminación de decisión (III)Ejemplo de eliminación de decisión (III)
36
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
Ejemplo de eliminación de decisión Ejemplo de eliminación de decisión cuando más de una rama depende de la cuando más de una rama depende de la decisióndecisión
37
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
Ejemplo de eliminación de decisión Ejemplo de eliminación de decisión cuando más de una rama depende de la cuando más de una rama depende de la decisióndecisión Necesidad de Necesidad de reducirreducir las ramas dependientes las ramas dependientes
a una solaa una sola
38
Eliminación de variables Eliminación de variables para DI con nodos SVpara DI con nodos SV
Procedimiento generalProcedimiento general Determinar el orden de eliminación de variablesDeterminar el orden de eliminación de variables Construir el árbol equivalente a la matriz y factorizarloConstruir el árbol equivalente a la matriz y factorizarlo MIENTRAS queden variables por eliminarMIENTRAS queden variables por eliminar
Sea X la variable a eliminarSea X la variable a eliminar SI X es variable aleatoriaSI X es variable aleatoria
Aplicar sucesivamente el proceso de compactar hojas y Aplicar sucesivamente el proceso de compactar hojas y distribuir * en relación a X hasta que no queden nodos * distribuir * en relación a X hasta que no queden nodos * que distribuirque distribuir
Marginalizar en A en las hojas del árbol dependientes de AMarginalizar en A en las hojas del árbol dependientes de A Si X es decisiónSi X es decisión
Determinar el menor subárbol que abarque todas las ramas Determinar el menor subárbol que abarque todas las ramas dependientes de Ddependientes de D
Reducir a una hoja dicho subárbolReducir a una hoja dicho subárbol Maximizar en D dicho potencial hojaMaximizar en D dicho potencial hoja
FIN MIENTRASFIN MIENTRAS Corrección y terminación del algoritmoCorrección y terminación del algoritmo
39
Ejemplo de evaluaciónEjemplo de evaluación
MEU = MEU = BB max maxD D AA ΦΦ11(A) (A) ΦΦ22(B) (U(B) (U11(A)+(U(A)+(U22(A, (A, D)*UD)*U33(B)))(B)))
Matriz: Matriz: ΦΦ11(A) (A) ΦΦ22(B) (U(B) (U11(A)+(U(A)+(U22(A, D)*U(A, D)*U33(B)))(B)))
40
Ejemplo de evaluaciónEjemplo de evaluación
Eliminar AEliminar A Aplicar distributiva en Aplicar distributiva en
el nodo raíz (único a el nodo raíz (único a distribuir)distribuir)
41
Ejemplo de evaluaciónEjemplo de evaluación Eliminar AEliminar A
Compactar tras Compactar tras distribuirdistribuir
Marginalizar en las Marginalizar en las hojashojas
42
Ejemplo de evaluaciónEjemplo de evaluación Eliminar DEliminar D
Reducir subárbol Reducir subárbol con más de una con más de una ramarama
43
Ejemplo de evaluaciónEjemplo de evaluación
Eliminar DEliminar D No ha sido No ha sido
necesario reducir necesario reducir ningún subárbolningún subárbol
La estrategia La estrategia óptima para D no óptima para D no ha dependido de ha dependido de BB
44
Ejemplo de evaluaciónEjemplo de evaluación
Eliminar BEliminar B Aplicar Aplicar
distributiva en distributiva en el único nodo a el único nodo a distribuir (raíz)distribuir (raíz)
45
Ejemplo de evaluaciónEjemplo de evaluación Eliminar BEliminar B
Compactar Compactar tras distribuirtras distribuir
Marginalizar Marginalizar en las hojasen las hojas
46
ConclusionesConclusiones Se ha evitado la carga computacional de la inversión Se ha evitado la carga computacional de la inversión
de arcosde arcos La separabilidad de la función de valor se preserva el La separabilidad de la función de valor se preserva el
máximo tiempo posiblemáximo tiempo posible Realiza una menor destrucción de la estructura de nodos de Realiza una menor destrucción de la estructura de nodos de
valor que el algoritmo de Tatman y Shachtervalor que el algoritmo de Tatman y Shachter Sólo aplica la distributividad cuando es necesario y a las ramas Sólo aplica la distributividad cuando es necesario y a las ramas
imprescindiblesimprescindibles Potenciales de un tamaño menor durante la evaluaciónPotenciales de un tamaño menor durante la evaluación
Mejora en la determinación de las variables requeridasMejora en la determinación de las variables requeridas No es necesario “eliminar redundancia” antes de comenzar la No es necesario “eliminar redundancia” antes de comenzar la
evaluaciónevaluación Variables requeridas para cada decisión son en el peor caso las Variables requeridas para cada decisión son en el peor caso las
mismas que con el algoritmo de Tatman y Shachter y un mismas que con el algoritmo de Tatman y Shachter y un subconjunto en otros casos (ver ejemplo)subconjunto en otros casos (ver ejemplo)
Lo mismo le sucede respecto al algoritmo de eliminación de Lo mismo le sucede respecto al algoritmo de eliminación de variables de Jensen “tradicional”variables de Jensen “tradicional”
47
Perspectivas futuras y Perspectivas futuras y ElviraElvira
Situación actual de la “eliminación de redundancia” en ElviraSituación actual de la “eliminación de redundancia” en Elvira Realizada antes de la evaluación a través del algoritmo de Realizada antes de la evaluación a través del algoritmo de
Faguiouli y ZaffalonFaguiouli y Zaffalon Método de eliminación de variables de Jensen “tradicional” con Método de eliminación de variables de Jensen “tradicional” con
unión de los nodos de utilidadunión de los nodos de utilidad En este momento DI con nodos SV son evaluados con En este momento DI con nodos SV son evaluados con
algoritmos para DI sin nodos SV (ReductionAndEvalID)algoritmos para DI sin nodos SV (ReductionAndEvalID) Incorporación del algoritmo propuesto a Elvira Incorporación del algoritmo propuesto a Elvira
(VariableEliminationSV)(VariableEliminationSV) Estudio de mejoras en la aplicación de la distributividadEstudio de mejoras en la aplicación de la distributividad
Selección de las ramas a distribuirSelección de las ramas a distribuir Reestructuración previa de las ramas antes de distribuir para Reestructuración previa de las ramas antes de distribuir para
conseguir mayor factorización tras ella (agrupar ramas no conseguir mayor factorización tras ella (agrupar ramas no dependientes de la variable a eliminar)dependientes de la variable a eliminar)
En la implementación el árbol se transforma en grafo dirigido En la implementación el árbol se transforma en grafo dirigido para conseguir un ahorro en memoria tras distribuir (el para conseguir un ahorro en memoria tras distribuir (el ahorro en tiempo ya lo daba la compactación) al compartir ahorro en tiempo ya lo daba la compactación) al compartir subárbolessubárboles