4.2 sistemas de razonamiento probabilistico

29
Inteligencia Artificial Sistemas de Razonamiento Probabilístico

Upload: luis-garcia

Post on 17-Dec-2015

15 views

Category:

Documents


1 download

DESCRIPTION

inteligencia artificial

TRANSCRIPT

  • Inteligencia ArtificialSistemas de Razonamiento Probabilstico

  • SISTEMAS DE RAZONAMIENTO PROBABILISTICOSon sistemas de razonamiento basados en modelos de redes y, con base en las leyes de la teora de la probabilidad, se emplean para razonar en situaciones de incertidumbre.La principal ventaja del razonamiento probabilstico en comparacin con el razonamiento lgico es que el agente lgico puede tomar decisiones racionales an si disponer de suficiente informacin para probar que una accin dada funcionar.

  • REPRESENTACIN DEL CONOCIMIENTO EN UN DOMINIO INCIERTOSi bien la distribucin de probabilidad conjunta puede dar respuesta a cualquier pregunta relacionada con un dominio determinado, conforme aumenta la cantidad de variables, su magnitud se convierte intratablemente extensa.Adems, no resulta muy natural la especificacin de probabilidades de eventos atmicos y puede volverse bastante complicada, a menos de contar con una gran cantidad de datos que permita recopilar estimaciones estadsticas.

  • REPRESENTACIN DEL CONOCIMIENTO EN UN DOMINIO INCIERTOTambin, las relaciones de independencia condicional que existen entre las variables permiten simplificar el clculo de los resultados de una consulta y reducir tambin la cantidad de probabilidades condicionales que es necesario especificar.Para representar la dependencia que existe entre determinadas variables, se usa una estructura de datos conocida como red bayesiana (red de creencia, red probabilstica, red causa, mapa de conocimiento).

  • REPRESENTACIN DEL CONOCIMIENTO EN UN DOMINIO INCIERTOLa red bayesiana es una grfica en la que se cumple lo siguiente:Los nodos de la red estn formados por un conjunto de variables aleatorias.Cada par de nodos se conecta entre s mediante un conjunto de enlaces o flechas. El significado implcito de una flecha que vaya del nodo X al nodo Y es el de que X ejerce una influencia directa sobre Y.Por cada nodo hay una tabla de probabilidad condicional que sirve para cuantificar los efectos de los padres sobre el nodo. Los padres de un nodos son aquellos cuyas flechas apuntan hacia ste.La grfica no tiene ciclos dirigidos (es acclica).

  • REPRESENTACIN DEL CONOCIMIENTO EN UN DOMINIO INCIERTORoboTerremotoAlarmaJuanllamaMaryllama

  • REPRESENTACIN DEL CONOCIMIENTO EN UN DOMINIO INCIERTOTabla de Probabilidad Condicional para la Alarma

    P(Alarma | Robo, Terremoto)Robo Terremoto truefalse

    truetrue0.9500.050truetrue0.9500.050falsetrue0.2900.710falsefalse0.0010.999

  • REPRESENTACIN DEL CONOCIMIENTO EN UN DOMINIO INCIERTORoboTerremotoAlarmaJuanllamaMaryllamaP(B).001P(E).002B E P(A)T T .95T F .94F T .29F F .001A P(J)T .90F .05A P(M)T .70F .01

  • LA SEMANTICA DE LAS REDES BAYESIANASHay dos maneras de interpretar las redes bayesianas:Considerar la red como una representacin de la distribucin de probabilidad conjunta. Esto es til para poder saber cmo construir redes.Considerar la red como la codificacin de un conjunto de aseveraciones de independencia condicional. Esto es til para el diseo de procedimientos de inferencia.

  • Representacin de la distribucin de probabilidad conjuntaLa red bayesiana permite obtener una descripcin completa del dominio. Una entrada genrica en la probabilidad conjunta es la probabilidad de que se de la conjuncin de determinadas asignaciones a cada una de las variables: P(X1=x1 ... Xn=xn)Que se abrevia como:P(x1, ... , xn)Se calcula como:

    (1)

  • Representacin de la distribucin de probabilidad conjuntaEjemplo: Se puede calcular la probabilidad del evento de que suene la alarma sin que se hayan producido ni el robo ni el terremoto, habiendo llamado tanto Juan como Mary.

  • Un mtodo para construir redes bayesianasLa ecuacin (1) define el significado de una determinada red bayesiana. Sin embargo, no explica cmo construir una red bayesiana de manera que la distribucin conjunta resultante sea una buena representacin de un determinado dominio.La ecuacin (1) implica ciertas relaciones de independencia condicional que pueden servir a un ingeniero de conocimiento como guas para construir la topologa de la red.

  • Un mtodo para construir redes bayesianasReescribiendo la conjuncin en funcin de una probabilidad condicional, se tiene que:

    Repitiendo este procedimiento, reduciendo cada una de las probabilidades conjuntivas a una probabilidad condicional y a una conjuncin ms pequea, se obtiene al final:

  • Un mtodo para construir redes bayesianasSi comparamos lo anterior con la ecuacin (1), tenemos:

    Suponiendo que Padres(Xi){xi-1,...,x1}. Esta ltima condicin se puede satisfacer sin mayor problema identificando los nodos de acuerdo con un orden congruente con el orden parcial implcito en la estructura de la grfica.

    (2)

  • Un mtodo para construir redes bayesianasLa ecuacin anterior significa que la red bayesiana ser la representacin correcta del dominio si cada uno de los nodos tiene independencia condicional respecto de sus predecesores en la secuencia de nodos, tomando como referencia a sus padres.Por lo tanto, si se desea construir una red bayesiana cuya estructura sea la adecuada para el dominio, hay que escoger los padres de cada nodo de manera que se satisfaga la propiedad anterior.

  • Un mtodo para construir redes bayesianasProcedimiento general para construir una red bayesiana:Escoger el conjunto de variables Xi que sirvan para describir el dominio.Definir la manera como se van a ordenar las variables.Siempre que haya variables:Por cada variable Xi que se escoja, aadir a la red un nodoAsignar Padres(Xi) a un conjunto mnimo de nodos que est presente en la red, para de esta manera satisfacer la propiedad de independencia condicional (2).Elaborar la tabla de probabilidad condicional correspondiente a XiEste mtodo evita la construccin de redes con ciclos y con l adems es imposible violar los axiomas de probabilidad.

  • Compactacin y ordenamiento de nodosLa compactacin de las redes bayesianas es un ejemplo de una propiedad muy general de los sistemas localmente estructurados. En estos sistemas, los subcomponentes interactan directamente slo con una cantidad limitada de otros componentes, independientemente de cul sea la cantidad total de componentes.La complejidad de la estructura local es de tipo lineal, no exponencial. En el caso de las redes bayesianas, es razonable suponer que en la mayora de los dominios, cada una de las variables recibe influencia de cuando mucho otras k variables aleatorias, siendo k un valor constante.

  • Compactacin y ordenamiento de nodosAn en el caso de un dominio de estructuracin local, el construir una red bayesiana no es un problema trivial.Tambin es necesario que la topologa de la red refleje en realidad tales influencias directas a travs del conjunto de padres adecuado.La manera correcta de aadir los nodos consiste en poner primero las causas raz y despus las variables sobre las que tienen influencia y as sucesivamente, hasta llegar a la parte de las hojas, las que no ejercen ninguna ingluencia causal sobre las otras variables.

  • Compactacin y ordenamiento de nodosRed Bayesiana resultado de un orden equivocado al agregar nodos: Maryllama Juanllama Terremoto Robo AlarmaMaryllamaJuanllamaTerremotoRoboAlarma

  • Representacin de las tablas de probabilidad condicionalDada la cantidad de posibles casos de condicionamiento, para llenar la tabla se necesita bastante tiempo y mucha experiencia.En realidad esto sucede en el peor de los casos, cuando la relacin que existe entre padres e hijos es totalmente arbitraria. Por lo general, la relacin padre-hijo corresponde a una de varias categoras que tienen distribuciones cannicas, es decir, un patrn estandar.El ejemplo ms sencillo son los nodos deterministas, donde su valor est definido exactamente por los nodos de los padres, sin lugar a incertidumbre.

  • Representacin de las tablas de probabilidad condicionalEjemplos de nodos deterministas:El nodo norteamericano es una disyuncin de sus padres canadiense, estadounidense y mexicano.Si los nodos padres son precios en distintas tiendas y el hijo es el precio final a pagar, el hijo es el mnimo de los padres.

  • Relaciones de independencia condicional en las redes bayesianasDada una red, es posible saber si un conjunto de nodos X es independiente de otro conjunto Y, con base en el conjunto de los nodos de evidencia E? La respuesta es s, y el mtodo se deriva del concepto de separacin dependiente de la direccin o separacin d.Si la ruta no dirigida (independiente de la direccin de las flechas) que va de un nodo que est en X a un nodo que est en Y tiene una separacin dependiente de la direccin (d) por E, entonces tanto X como Y son condicionalmente independientes en funcin de E.

  • Relaciones de independencia condicional en las redes bayesianasEl conjunto de nodos E separa con dependencia de la direccin (d) dos conjuntos de nodos X y Y cuando todas las rutas no dirigidas que van de un nodo que est en X a un nodos que est en Y estn bloqueadas, en funcin de E.Una ruta est bloqueada en funcin de un conjunto de nodos E si en la ruta existe un nodo Z en el cual se cumple una de las tres condiciones siguientes:Z est en E y una de las flechas entra y la otra sale de ZZ est en E y las dos flechas de la ruta salen de ZNi Z ni sus descendientes estn en E, y las dos flechas de la ruta entran a Z.

  • Relaciones de independencia condicional en las redes bayesianasRutas BloqueadasZZZ123XEYY

  • Relaciones de independencia condicional en las redes bayesianasEjemplo para demostrar que los nodos con separacin dependiente de la direccin (d) son condicionalmente independientes:BateraRadioIgnicinArranqueGasMovimiento

  • Relaciones de independencia condicional en las redes bayesianasEjemplo para demostrar que los nodos con separacin dependiente de la direccin (d) son condicionalmente independientes:1. El que el carro tenga Gasolina y que se oiga el Radio son independientes si se cuenta con evidencia de que las bujas estn flameadas (la Ignicin no funciona).2. Gasolina y Radio son independientes cuando se sabe que la Batera funciona.3. La Gasolina y el Radio son independientes cuando no se cuenta con ninguna evidencia. Sern dependientes cuando hay alguna evidencia acerca del Arranque del auto. Por ejemplo, si el carro no arranca, el que se escuche el radio es evidencia mayor de que nos hemos quedado sin gasolina. La Gasolina y el Radio son dependientes cuando se cuenta con evidencia acerca del Movimiento del auto, puesto que esto se produce con el arranque del carro.

  • LA INFERENCIA EN LAS REDES BAYESIANASEl principal objetivo de un sistema de inferencia probabilista es el clculo de la distribucin de probabilidad posterior de un conjunto de variables de consulta, con base en determinadas variables de evidencia. Es decir, el sistema calcula P(Consulta|Evidencia).En general, el agente asigna valores a las variables de evidencia basndose en sus percepciones (o en otro tipo de razonamientos) y solicita el posible valor de otras variables de manera que le permita decidir qu tipo de accin a emprender.

  • La naturaleza de las inferencias probabilistasLas redes bayesianas no se limitan a un razonamiento de diagnstico; de hecho efectan cuatro tipos de inferencia:Inferencias por diagnstico (de los efectos a las causas).Con base en que JuanLlama, calcular P(Robo|JuanLlama)Inferencias causales (de las causas a los efectos).Con base en Robo, calcular P(JuanLlama|Robo) y P(MaryLlama|Robo)Inferencias intercausales (entre las causas de un efecto comn)Con base en Alarma, calcular P(Robo|Alarma). Al aadir Temblor, calcular la nueva P(Robo|Alarma Temblor)Inferencias mixtas (combinacin de una o varias de las anteriores)Dados JuanLlama y Temblor, calcular P(Alarma|JuanLlama Temblor) y P(Robo| JuanLlama Temblor)

  • La naturaleza de las inferencias probabilistasTipos de inferenciasQEEQQEEQEdiagnsticacausalmixtaintercausal