file

Departamento de Informatica

Universidad Carlos III de Madrid

Ingeniera enInformatica

Inteligencia ArtificialNoviembre 2007

Hoja de Ejercicios 4:Busqueda heurstica y de dos agentes

Comentarios generales sobre los ejercicios Asumiendo que se conocen los contenidos teoricos, el tiempo estimadopara realizar los ejercicios es de 2 horas

Describir las soluciones a los ejercicios de una manera lo mas formalposible

Ejercicio 1

Aplicar el algoritmo de busqueda A* sobre la representacion del problema de los misioneros y los canbalesextrada de la anterior hoja de problemas. Especifica cuando un nodo del arbol de busqueda es expandido y cuandoes solo generado. A modo de resumen, se describen los siguientes elementos:

1. Un estado es una terna (Mi, Ci, B,Mf , Cf ) en la que:

B [i, f ] indica la posicion de la barca, por lo que toma el valor i si esta en el extremo inicial, o f siesta en el final

Mi, Ci,Mf , Cf [0, . . . , 3] indican el numero de misioneros y canbales que quedan en el extremo inicialy final del ro, respectivamente

2. El estado inicial se representa como (3, 3, i, 0, 0) y el final como (0, 0, f, 3, 3)

3. Se dispone de cinco operadores: Mover1C(x,y), Mover2C(x,y), Mover1M(x,y), Mover2M(x,y), y Mover1M1C(x,y).

4. La heurstica a utilizar es:

h2(n) = 2 (Ci +Mi) orilla(n) (1)

donde orilla(n)=1 si en el estado n la barca esta en la orilla i (B = i), y orilla(n)=0 si la barca esta en laorilla final (B = f).

Ejercicio 2

Supongamos que tenemos un algoritmo de busqueda de tipo el mejor primero que utiliza la siguiente funcionde evaluzacion: f(n) = (2 w) g(n) + wh(n)

Que tipo de busqueda hace cuando w=0? y cuando w=1? y para w=2?

Para que valores de w el algoritmo es admisible?

Ejercicio 3

Hare & Hounds (Figura ??) es un juego de estrategia para 2 jugadores: la presa y el cazador. La presa decidelos movimientos de la liebre mientras que el cazador, decide los movimiento de los perros. La presa gana el juego siconsigue llegar de un extremo al otro del tablero. En cambio, el cazador gana si logra atrapar a la liebre, es decirsi se alcanza una situacion del juego en la que la liebre no puede realizar ningun movimiento. En cada turno cadajugador puede mover solo una ficha y siempre a una de las casillas adyacentes. Las fichas del cazador no puedenretroceder. El primer turno corresponde siempre al cazador. Se pide:

Indica posibles representaciones de los estados.

Describe los operadores del juego.

Que funciones de evaluacion se te ocurren para programar un jugador automatico inteligente de Hare &Hounds.

En http://www.appletonline.com/JavaApplets/HoundsAndHare/ puede encontrarse un applet para jugar aHare & Hounds.

Figura 1: Posicion inicial de la liebre y los perros en el juego de Hare & Hounds

Ejercicio 4

Se tiene un robot autonomo en una habitacion cuadrada de 6x6 casillas (Figura ??). El robot es capaz derealizar desplazamientos verticales y horizontales y reconoce un obstaculo si esta en una de las casillas adyacentes.Suponiendo que el robot utiliza algoritmos de busqueda para planificar sus movimientos contesta a las siguientespreguntas:

Figura 2: El Robot tiene que ir de una esquina de la habitacion a la otra

Que heurstica podra utilizar el robot para guiarse desde su posicion actual hasta el otro extremo de lahabitacion?

Que camino tomara el robot si su movimiento estuviese determinado por un algoritmo de busqueda enescalada con la heurstica del apartado anterior? Suponer que los estados sucesores se generan aplicando losoperadores de desplazamiento en este orden: [derecha, abajo, izquierda, arriba]?

Y siguiesen el orden:[arriba, izquierda, abajo, derecha] Que camino tomara?

Siguiendo el primer orden de operadores Que camino tomara el robot si sus movimientos estuviesen guiadospor un algoritmo de busqueda en haz con k=3?

Ejercicio 5

Recorrer el grafo de la figura ?? utilizando los algoritmos de busqueda heurstica: Escalada, A e IDA, teniendoen cuenta los costes indicados en cada arco.

A

B

C

D

E

F

GS

Z

1

1

7

3

25 3

53

4 4

2

1 1

Figura 3: Espacio de estados

En todos los casos, indicar en que orden se visitan los nodos, distinguiendo nodos generados de nodos expandidos.Tomar como estado inicial el nodo S y como unico estado meta el nodo G.

Cada nodo del grafo tiene el valor heurstico descrito en la tabla ??

n S A B C D E F G Zh(n) 8 2 3 5 4 6 6 0 1

Cuadro 1: Tabla de valores heursticos

Ejercicio 6

En algunas aplicaciones reales, el espacio de problemas se suele formular con un unico estado inicial, s, yun conjunto arbitrariamente grande de estados finales o meta : {t1, t2, . . . , tn}. Considerando los espacios deproblemas formulados de esta manera, y considerando unicamente el caso de espacios de estados no dirigidos, sepide:

Sin modificar la funcion heurstica que se este empleando, que modificaciones deben hacerse al algoritmo debusqueda A para que encuentre la secuencia optima de operadores que transforma un unico estado inicial,s, en uno cualquiera de varios estados meta : {t1, t2, . . . , tn}?

Solucion ejercicio 1

El algoritmo A, como todos los algoritmos de el mejor primero, se diferencia de sus predecesores, fundamentalmente,en lo siguiente:

Los nodos se almacenan en una lista denominada abierta por su valor f(n) ordenada ascendentemente. Deesta manera, el primer nodo de dicha lista es siempre el que tiene el menor valor f( )

En las figuras que siguen, los nodos en la lista abierta se muestran en el (sub)arbol de busqueda en unacaja solida, sin relleno como en el siguiente ejemplo:

(3, 2, f, 0, 1)g = 1h = 10

3

y debajo se indica, a su derecha, el orden que tiene el nodo en la lista abierta 3 en el ejemplo.

Para evitar la re-expansion de nodos, el algoritmo mantiene una lista cerrada con todos los nodos que hansido anteriormente expandidos.

A continuacion, los nodos expandidos se mostraran con una lnea que los rodea mas gruesa y sin ningunnumero debajo de ellos puesto que los nodos en la lista cerrada no tienen por que estar ordenados:

(3, 2, f, 0, 1)g = 1h = 10

El algoritmo no se detiene cuando genera eventualmente el nodo final sino cuando va a expandirlo. De acuerdocon el punto , esto significa que estando primero es el nodo con menor valor f( ) y, por lo tanto, la solucionencontrada sera optima si la funcion heurstica h( ) es admisible.

En la solucion, los estados inicial y final se han distinguido graficamente del resto con un nodo rellenado. Porejemplo, el estado inicial es:

(3, 3, i, 0, 0)g = 0h = 11

Por otra parte, de entre los algoritmos de el mejor primero, el algoritmo A se distingue porque emplea lafuncion de evaluacion f(n) = g(n) + h(n). En todos los nodos que se mostraran a continuacion, el valor de lafuncion de evaluacion se muestra explcitamente indicando el valor de sus componentes g(n) y h(n).

Por lo tanto, en terminos generales el algoritmo A opera siempre de la misma manera: coge el primer nodo dela lista abierta y, si no es el nodo final, lo expande (introduciendolo entonces en la lista cerrada) e inserta en lalista abierta todos los sucesores que no esten en la lista cerrada. Despues de evaluar cada sucesor, ordena todala lista abierta y as, sucesivamente, hasta que se encuentra el nodo final.

En lo sucesivo, los operadores se aplicaran, siempre, en el mismo orden en el que aparecen en el enunciado, yabreviados como sigue: 1C, 2C, 1M , 2M y 1M1C. Las veces que un operador no puede aplicarse, se indicara explcitamente,dibujando el nodo imposible atenuado y con lneas discontinuas:

(2, 3, f, 1, 0)g = 1h = 10

Ci > Mi 8En cualquier caso, es preciso observar que todos los operadores tienen el mismo coste, 1, por lo que el valor

g(n) de cualquier nodo n sera siempre igual a la profundidad del arbol en el que aparece.

Iteracion 1

Inicialmente, se considera que el nodo raz (3, 3, i, 0, 0) ha sido generado e insertado en la lista abierta que,por lo tanto, consiste en un unico elemento. La siguiente figura muestra el caso de su expansion:

(3, 3, i, 0, 0)g = 0h = 11

(3, 2, f, 0, 1)g = 1h = 10

3

1C

(3, 1, f, 0, 2)g = 1h = 8

1

2C

(2, 3, f, 1, 0)g = 1h = 10

Ci > Mi 8

1M

(1, 3, f, 2, 0)g = 1h = 8

Ci > Mi 8

2M

(2, 2, f, 1, 1)g = 1h = 8

2

1M1C

Como se ve, el nodo inicial es inmediatamente insertado en la lista cerrada (rodeado entonces de una lneamas gruesa) que ahora tiene un unico elemento. Notese que los nodos (2, 3, f, 1, 0) y (1, 3, f, 2, 0) son estadosimposibles puesto que en ellos Ci > Mi. Por lo tanto, se han generado hasta tres nodos nuevos, que son ordenadosascendentemente en la lista abierta segun el ndice que se muestra debajo de ellos1.

Iteracion 2

El primer nodo de la lista abierta, (3, 1, f, 0, 2) no es el estado final. Por lo tanto, es expandido a continuacioncomo se muestra en la siguiente figura:

(3, 3, i, 0, 0)g = 0h = 11

(3, 2, f, 0, 1)g = 1h = 10

2

1C

(3, 1, f, 0, 2)g = 1h = 8

2C

(3, 2, i, 0, 1)g = 2h = 9

3

1C

(3, 3, i, 0, 0)g = 2h = 11

cerrada 8

2C

(?, 1, f, ?, 2)g = 2h =?

Mf < 1 8

1M

(?, 1, f, ?, 2)g = 2h =?

Mf < 2 8

2M

(?, 1, f, ?, 2)g = 2h =?

Mf < 1 8

1M1C

(2, 2, f, 1, 1)g = 1h = 8

1

1M1C

Observese como uno de los nuevos sucesores, (3, 3, i, 0, 0) es desestimado inmediatamente por pertenecer a lalista cerrada o, en otras palabras, porque ya ha sido expandido anteriormente. Asimismo, todos los operadoresque pretendan desplazar misioneros desde la orilla final fallaran necesariamente puesto que all Mf = 0.

Despues de ordenar la lista con los nuevos sucesores, que ahora contiene unicamente el nodo (3, 2, i, 0, 1), ymezclarla con la lista ordenada que haba al inicio de esta iteracion despues de eliminar el nodo recien expandido,(3, 1, f, 0, 2), el nodo con mejor valor f(n) es (2, 2, f, 1, 1).

Iteracion 3

Puesto que el nodo (2, 2, f, 1, 1) no es el estado final, se expande inmediatamente como se muestra a continuacion:

(2, 2, f, 1, 1)g = 1h = 8

1M1C

(2, 3, i, 1, 0)g = 2h = 9

Ci > Mi 8

1C

(2, ?, i, 1, ?)g = 2h =?

Cf < 2 8

2C

(3, 2, i, 0, 1)g = 2h = 9

1

1M

(?, 2, i, ?, 1)g = 2h =?

Mf < 2 8

2M

(3, 3, i, 0, 0)g = 2h = 11

cerrada 8

1M1C

Observese que el unido sucesor, (3, 2, i, 0, 1), ya estaba en abierta! (al que se llego con anterioridad por elnodo (3, 1, f, 0, 2)) con el mismo valor f(n) = g(n) + h(n) = 2 + 9 = 112.

Por lo tanto, eliminando ahora los estados imposibles, los que ya estaban en cerrada, y los que no mejoranlas alternativas que ya hay en abierta, se tiene que el arbol de busqueda generado hasta ahora es:

1Por convenio, en caso de empate del valor de la funcion de evaluacion f( ), entre dos o mas nodos, se escogera siempre el primeromas a la izquierda.

2Es preciso advertir que si se hubiese generado un nuevo nodo que ya estuviese en abierta pero con una evaluacion f( ) menor, elprimero sera eliminado de la lista y, en su lugar, se introducira el nuevo descendiente, puesto que tiene un coste inferior.

(3, 3, i, 0, 0)g = 0h = 11

(3, 2, f, 0, 1)g = 1h = 10

1

1C

(3, 1, f, 0, 2)g = 1h = 8

2C

(3, 2, i, 0, 1)g = 2h = 9

2

1C

(2, 2, f, 1, 1)g = 1h = 8

1M1C

Ahora ha sucedido que todos los nodos en abierta tienen el mismo valor de f( ). Puesto que en caso de empate,se resuelve por convenio a favor del nodo mas a la izquierda, la busqueda proseguira por el nodo (3, 2, f, 0, 1).

Iteracion 4

Resulta muy facil observar que la expansion de este nodo no genera ningun sucesor util puesto que desde elextremo final con un unico canibal, la unica accion posible sera volver a traerlo hasta la orilla inicial, resultandoentonces el estado (3, 3, i, 0, 0) que ya ha sido expandido.

Por lo tanto, el nodo (3, 2, f, 0, 1) es expandido sin generar sucesores (de modo que la lista abierta no semodifica en absoluto) y despues de introducirlo en la lista cerrada resulta el siguiente arbol de busqueda:

(3, 3, i, 0, 0)g = 0h = 11

(3, 2, f, 0, 1)g = 1h = 10

1C

(3, 1, f, 0, 2)g = 1h = 8

2C

(3, 2, i, 0, 1)g = 2h = 9

1

1C

(2, 2, f, 1, 1)g = 1h = 8

1M1C

Iteracion 5

Con un unico nodo en abierta, (3, 2, i, 0, 1), la unica alternativa consiste en expandirlo como se muestra acontinuacion:

(3, 3, i, 0, 0)g = 0h = 11

(3, 2, f, 0, 1)g = 1h = 10

1C

(3, 1, f, 0, 2)g = 1h = 8

2C

(3, 2, i, 0, 1)g = 2h = 9

1C

(3, 1, f, 0, 2)g = 3h = 8

cerrada 8

1C

(3, 0, f, 0, 3)g = 3h = 6

1

2C

(2, 2, f, 1, 1)g = 3h = 8

cerrada 8

1M

(1, 2, f, 2, 1)g = 3h = 6

Ci > Mi 8

2M

(2, 1, f, 1, 2)g = 3h = 6

Cf > Mf 8

1M1C

(2, 2, f, 1, 1)g = 1h = 8

1M1C

Con un unico nodo en abierta, ya han sido expandidos hasta cinco nodos, actualmente en cerrada, a saber:(3, 3, i, 0, 0), (3, 2, f, 0, 1), (3, 1, f, 0, 2), (2, 2, f, 1, 1) y (3, 2, i, 0, 1).

Observese la utilidad del mecanismo implementado por la lista cerrada: efectivamente, desde el estado inicial,(3, 3, i, 0, 0), las trayectorias 2C, 1C, 1M y 1M1C son estrictamente equivalentes y, por ello, la primera puedeeliminarse, puesto que la segunda ya fue considerada (esto es, expandida) en la tercera iteracion.

Iteracion 6

En este caso, la mejor alternativa es unica, y el algoritmo A escoge el nodo (3, 0, f, 0, 3) para su expansion:

(3, 3, i, 0, 0)g = 0h = 11

(3, 2, f, 0, 1)g = 1h = 10

1C

(3, 1, f, 0, 2)g = 1h = 8

2C

(3, 2, i, 0, 1)g = 2h = 9

1C

(3, 0, f, 0, 3)g = 3h = 6

2C

(3, 1, i, 0, 2)g = 4h = 7

1

1C

(3, 2, i, 0, 1)g = 4h = 11

cerrada 8

2C

(?, 0, i, ?, 3)g = 4h =?

Mf < 1 8

1M

(?, 0, i, ?, 3)g = 4h =?

Mf < 2 8

2M

(?, 0, i, ?, 3)g = 4h =?

Mf < 1 8

1M1C

(2, 2, f, 1, 1)g = 1h = 8

1M1C

Iteracion 7

Una vez mas, la lista abierta contiene un unico nodo, por lo que se procede a su expansion. Puesto que no setrata del nodo final, el arbol de busqueda resulta quedar como se muestra a continuacion:

(3, 3, i, 0, 0)g = 0h = 11

(3, 2, f, 0, 1)g = 1h = 10

1C

(3, 1, f, 0, 2)g = 1h = 8

2C

(3, 2, i, 0, 1)g = 2h = 9

1C

(3, 0, f, 0, 3)g = 3h = 6

2C

(3, 1, i, 0, 2)g = 4h = 7

1C

(3, 0, f, 0, 3)g = 5h = 6

cerrada 8

1C

(3, ?, f, 0, ?)g = 5h =?

Ci < 2 8

2C

(2, 1, f, 1, 2)g = 5h = 6

Mf < Cf 8

1M

(1, 1, f, 2, 2)g = 5h = 4

1

2M

(2, 0, f, 1, 3)g = 5h = 4

Cf > Mf 8

1M1C

(2, 2, f, 1, 1)g = 1h = 8

1M1C

Iteracion 8

Como ocurriera en la iteracion anterior, abierta tiene de nuevo un unico nodo. Despues de su expansion, elarbol de busqueda resultante es:

(3, 3, i, 0, 0)g = 0h = 11

(3, 2, f, 0, 1)g = 1h = 10

1C

(3, 1, f, 0, 2)g = 1h = 8

2C

(3, 2, i, 0, 1)g = 2h = 9

1C

(3, 0, f, 0, 3)g = 3h = 6

2C

(3, 1, i, 0, 2)g = 4h = 7

1C

(1, 1, f, 2, 2)g = 5h = 4

2M

(1, 2, i, 2, 1)g = 6h = 5

Ci > Mi 8

1C

(1, 3, i, 2, 0)g = 6h = 7

Ci > Mi 8

2C

(2, 1, i, 1, 2)g = 6h = 5

Mf < Cf 8

1M

(3, 1, i, 0, 2)g = 6h = 7

cerrada 8

2M

(2, 2, i, 1, 1)g = 6h = 7

1

1M1C

(2, 2, f, 1, 1)g = 1h = 8

1M1C

Es importante observar que el unico nodo que ahora tenemos en abierta, no es como el nodo (2, 2, f, 1, 1) encerrada, puesto que mientras que en este caso, la barca se encuentra en la orilla inicial, en aquel caso esta en laorilla final.

Iteracion 9

Una vez mas, el numero de elementos en abierta es uno. Por lo tanto, despues de la expansion de la unicaalternativa disponible, resulta:

(3, 3, i, 0, 0)g = 0h = 11

(3, 2, f, 0, 1)g = 1h = 10

1C

(3, 1, f, 0, 2)g = 1h = 8

2C

(3, 2, i, 0, 1)g = 2h = 9

1C

(3, 0, f, 0, 3)g = 3h = 6

2C

(3, 1, i, 0, 2)g = 4h = 7

1C

(1, 1, f, 2, 2)g = 5h = 4

2M

(2, 2, i, 1, 1)g = 6h = 7

1M1C

(2, 1, f, 1, 2)g = 7h = 6

Mf < Cf 8

1C

(2, 0, f, 1, 3)g = 7h = 4

Mf < Cf 8

2C

(1, 2, f, 2, 1)g = 7h = 6

Mi < Ci 8

1M

(0, 2, f, 3, 1)g = 7h = 4

1

2M

(1, 1, f, 2, 2)g = 7h = 4

cerrada 8

1M1C

(2, 2, f, 1, 1)g = 1h = 8

1M1C

Iteracion 10

Puesto que no hay mas alternativa que la expansion del nodo (0, 2, f, 3, 1), el nuevo arbol de busqueda resultara ser:

(3, 3, i, 0, 0)g = 0h = 11

(3, 2, f, 0, 1)g = 1h = 10

1C

(3, 1, f, 0, 2)g = 1h = 8

2C

(3, 2, i, 0, 1)g = 2h = 9

1C

(3, 0, f, 0, 3)g = 3h = 6

2C

(3, 1, i, 0, 2)g = 4h = 7

1C

(1, 1, f, 2, 2)g = 5h = 4

2M

(2, 2, i, 1, 1)g = 6h = 7

1M1C

(0, 2, f, 3, 1)g = 7h = 4

2M

(0, 3, i, 3, 0)g = 8h = 5

1

1C

(1, ?, i, 2, ?)g = 8h =?

Cf < 2 8

2C

(1, 2, i, 2, 1)g = 8h = 5

Mi < Ci 8

1M

(2, 2, i, 1, 1)g = 8h = 7

cerrada 8

2M

(1, 3, i, 2, 0)g = 8h = 7

Mi < Ci 8

1M1C

(2, 2, f, 1, 1)g = 1h = 8

1M1C

Iteracion 11

Nuevamente, hay un unico nodo que expandir, (0, 3, i, 3, 0):

(3, 3, i, 0, 0)g = 0h = 11

(3, 2, f, 0, 1)

1C

(3, 1, f, 0, 2)

2C

(3, 2, i, 0, 1)

1C

(3, 0, f, 0, 3)

2C

(3, 1, i, 0, 2)

1C

(1, 1, f, 2, 2)

2M

(2, 2, i, 1, 1)

1M1C

(0, 2, f, 3, 1)

2M

(0, 3, i, 3, 0)g = 8h = 5

1C

(0, 2, f, 3, 1)g = 9h = 4

cerrada 8

1C

(0, 1, f, 3, 2)g = 9h = 2

1

2C

(?, 3, f, ?, 0)g = 9h =?

Mi < 1 8

1M

(?, 3, f, ?, 0)g = 9h =?

Mi < 2 8

2M

(?, 2, f, ?, 1)g = 9h = 4

Mi < 1 8

1M1C

(2, 2, f, 1, 1)

1M1C

Iteracion 12

Y puesto que f((0, 1, f, 3, 2)) = 9+ 2 < 8+ 7 = f((1, 3, i, 2, 0)), el algoritmo A elige para su expansion el nodo(0, 1, f, 3, 2):

(3, 3, i, 0, 0)g = 0h = 11

(3, 2, f, 0, 1)

1C

(3, 1, f, 0, 2)

2C

(3, 2, i, 0, 1)

1C

(3, 0, f, 0, 3)

2C

(3, 1, i, 0, 2)

1C

(1, 1, f, 2, 2)

2M

(2, 2, i, 1, 1)

1M1C

(0, 2, f, 3, 1)

2M

(0, 3, i, 3, 0)

1C

(0, 1, f, 3, 2)g = 9h = 2

2C

(0, 2, i, 3, 1)g = 10h = 3

1

1C

(0, 3, i, 3, 0)g = 10h = 5

cerrada 8

2C

(1, 1, i, 2, 2)g = 10h = 3

2

1M

(2, 1, i, 1, 2)g = 10h = 5

Mf < Cf 8

2M

(1, 2, i, 2, 1)g = 10h = 7

Ci > Mi 8

1M1C

(2, 2, f, 1, 1)

1M1C

Iteracion 13

En este momento, hay hasta tres nodos en abierta, ordenados tal y como se indica en la figura anterior. Enrealidad, es trivial comprobar que expandiendo cualesquiera de los dos nodos con la menor puntuacion f( ), segenera por fin el estado final. Sin embargo, el algoritmo A no se detiene cuando genera una solucion esto es, uncamino desde el nodo inicial hasta el nodo final.

El arbol resultante despues de la expansion del primer nodo en abierta es:

(3, 3, i, 0, 0)g = 0h = 11

(3, 2, f, 0, 1)

1C

(3, 1, f, 0, 2)

2C

(3, 2, i, 0, 1)

1C

(3, 0, f, 0, 3)

2C

(3, 1, i, 0, 2)

1C

(1, 1, f, 2, 2)

2M

(2, 2, i, 1, 1)

1M1C

(0, 2, f, 3, 1)

2M

(0, 3, i, 3, 0)

1C

(0, 1, f, 3, 2)

2C

(0, 2, i, 3, 1)g = 10h = 3

1C

(0, 1, f, 3, 2)g = 11h = 2

2

1C

(0, 0, f, 3, 3)g = 11h = 0

1

2C

(?, 2, f, ?, 1)g = 11h =?

Mi < 1 8

1M

(?, 2, f, ?, 1)g = 11h =?

Mi < 2 8

2M

(?, 1, f, ?, 2)g = 11h =?

Mi < 1 8

1M1C

(1, 1, i, 2, 2)g = 10h = 3

3

1M

(2, 2, f, 1, 1)

1M1C

Notese que el nodo final (0, 0, f, 3, 3) es el primero (y en realidad, el unico) con h = 0. Puesto que las funcionesheursticas admisibles no pueden sobreestimar el esfuerzo hasta una solucion, y desde el nodo final, el coste optimoes necesariamente h = 0, se sigue que h = 0.

Iteracion 14

Sin embargo, no sera hasta la decimocuarta iteracion cuando por fin se acabe la busqueda. Puesto que el nodo(0, 0, f, 3, 3) es, de todos los nodos en abierta, el que tiene el menor valor f( ), puede garantizarse que no hayninguna otra alternativa (o nodo en abierta aguardando a ser expandido) que pueda encontrar una solucion menor,siempre que la funcion heurstica h( ) sea admisible!, como ocurre en este caso.

Por lo tanto, cuando el algoritmo A se dispone a expandir el primer nodo en abierta, advierte que se tratadel estado final y termina con la solucion optima siguiente: 2C, 1C, 2C, 1C, 2M, 1M1C, 2M, 1C, 2C, 1C, 2C


Este es un problema excelente para el estudio de la relacion entre g(n) y h(n), as como de su impacto en f(n)cuando es usada por la clase de algoritmos denominada de el mejor primero.

Los algoritmos de el mejor primero emplean un valor f(n) para ordenar ascendentemente los nodos en abierta.Esto es, en cada iteracion, escogen el primer nodo (que tendra el menor valor de f( )) en abierta para serexpandido. Ademas, puesto que estos algoritmos no se detienen hasta que por fin proceden a expandir el estadofinal, un resultado bien conocido de esta clase de algoritmos es que expanden todos los nodos con f(n) C, dondeC es el coste obtenido en la resolucion del estado inicial, s y que sera optimo o no, si la funcion heurstica, h(n)empleada es admisible o no segun se discute a continuacion.

Por lo tanto, la eleccion de f(n) es fundamental, no solo a proposito del rendimiento del algoritmo (ya sea enel numero de nodos expandidos o el tiempo que se tarda en encontrar la solucion), sino incluso a proposito de suspropiedades de admisibilidad, esto es, si encontrara o no soluciones optimas.

Considerando ahora la expresion general para f(n) siguiente: f(n) = g(n) + h(n), donde g(n) es el costeconocido para llegar desde el nodo inicial, s, hasta el nodo n y h(n) es una estimacion del coste para llegar hastael estado final, t, se consideran los siguientes casos:

La funcion heurstica empleada, h(n), es admisible, esto es, no sobreestima el esfuerzo para llegar hasta elnodo final, t, desde el nodo n. En otras palabras: h(n) h(n), donde h(n) es el coste optimo para llegarhasta el estado final desde el nodo n.

Cuando la funcion heurstica es admisible, se sabe que los algoritmos de el mejor primero encuentransoluciones optimas.

Un caso especial de admisibilidad de la funcion heurstica es h(n) = 0 n puesto que el coste paraalcanzar el estado final sera siempre mayor o igual que 0!

A proposito de este caso, cuando un algoritmo no emplea funciones heursticas, h(n), con el proposito deestimar el esfuerzo para llegar a la solucion, a partir del nodo n, y en su lugar emplea unicamente unamedida del esfuerzo realizado para llegar hasta el nodo n desde el nodo inicial (esto es, si f(n) = g(n)),se sabe que el algoritmo de el mejor primero resultante es Dijkstra.

Este algoritmo es capaz de encontrar soluciones optimas al estado inicial, s, pero lo hace calculando lassoluciones optimas de todos los estados, n, alcanzables desde el estado inicial con un coste

menor o igual que el optimo, h(s).

Esta conclusion es facil de entender si se comprende: primero, que h(n) es admisible, como se ha mostrado,de modo que C sera el coste optimo para resolver el estado inicial, h(s); segundo, que los algoritmosde el mejor primero expanden todos los nodos con f(n) = g(n) C = h(s), como se discuta alprincipio.

El caso general de admisibilidad de la funcion heurstica, consiste en incrementar el valor de f(n) enuna cantidad h(n), tal que h(n) h(n). De hecho, esta es la expresion que emplean los algoritmos A

e IDA y, en terminos generales, practicamente todos los algoritmos admisibles de el mejor primero.

A diferencia del algoritmo de Dijkstra, pero razonando de la misma manera que entonces, estos algoritmosexpanden todos los nodos con f(n) C, pero ahorrando una cantidad considerable de expansiones:todas aquellas para las que g(n) + h(n) excede el coste optimo del estado inicial.

El ultimo caso digno de mencion es cuando el calculo de f(n) se resume al computo de h(n), esto es,cuando no se considera el coste conocido g(n): f(n) = h(n).

Como antes, el algoritmo de el mejor primero resultante, expandira nodos con f(n) = h(n) C. Ahorabien, resulta facil observar que las soluciones encontradas no tienen por que ser optimas en absoluto.Considerense dos nodos n1 y n2 con h(n1) = h(n2) pero tal que g(n1) < g(n2), de modo que, en realidad,el nodo n1 es preferible al nodo n2 puesto que es mas barato llegar hasta el y la estimacion para llegarhasta t desde n1 es igual que desde n2, mas caro de alcanzar desde el nodo inicial, s. Sin embargo, puestoque este algoritmo no considera los costes g(n) podra igualmente expandir el nodo n2 antes que n1.

La funcion heurstica empleada, h(n) no es admisible y, por lo tanto, s sobreestima el esfuerzo para llegarhasta el nodo final, t, desde el nodo n o, equivalentemente: h(n) > h(n).

Un resultado muy importante en Inteligencia Artificial es que si se expresa la sobreestimacion como un factor, esto es, si se dice que f(n) = g(n)+(1+ )h(n), el algoritmo de el mejor primero resultante no excedera elcoste optimo del estado inicial, h(s), en (1 + ) o, en otras palabras, que C (1 + )h(s).

Despues de la discusion de estos casos, solo sera preciso relacionar los valores w propuestos en el enunciado conlos casos conocidos.

Puesto que en el enunciado no se deca nada sobre la admisibilidad o no de la funcion heurstica, se estudiaranambos casos. Primero, si la funcion heurstica h( ) es admisible:

Con w = 0, se tiene f(n) = 2g(n), que se distingue del caso estudiado f(n) = g(n) en el factor, 2.Sin embargo, es facil advertir que los nodos ordenados por f(n) = g(n) no cambiaran en absoluto su posicionen abierta con f(n) = 2g(n), puesto que si un valor f(n1) es menor o igual que cualquier otro f(n2),necesariamente se sigue que 2f(n1) 2f(n2).

Por lo tanto, con w = 0, el algoritmo resultante es Dijkstra, tal y como se discutio en el punto .

Con w = 1, se tiene f(n) = g(n) + h(n), exactamente la misma funcion de evaluacion empleada por losalgoritmos A e IDA, discutida en el punto

Con w = 2, resulta la funcion de evaluacion f(n) = 2h(n), que se asimila inmediatamente al punto ,razonando sobre la ordenacion de la lista abierta como en el caso w = 0.

De todos los casos mencionados, notese que solo y devolvan soluciones optimas si h( ) es admisible, taly como se explicaba all.

Por lo tanto, siempre que la funcion heurstica empleada sea admisible, los valores de w para los que elalgoritmo resultante es admisible son w [0, 1]3.

Por ultimo, en caso de que la funcion heurstica h( ) no sea admisible:

Si w = 0, se tiene f(n) = 2g(n), como en el caso w = 0 anterior. Por lo tanto, puesto que f(n) no usalos valores de h( ), se siguen aqu las mismas conclusiones que en el caso w = 0 con funciones heursticasadmisibles.

Si w = 1 resultara, como antes f(n) = g(n) + h(n). Por otra parte, si h(n) es inadmisible, existira algun > 0, tal que h(n) (1 + )h(n), de modo que, tal y como se vio anteriormente, el coste C calculado porel algoritmo de el mejor primero resultante no excedera el optimo en una cantidad igual a (1 + ).

Si w = 2, la funcion de evaluacion resultante, f(n) = 2h(n) es inherentemente inadmisible y, si en el casode funciones heursticas admisibles ya se haba demostrado que el algoritmo podra encontrar solucionesno optimas, el mismo caso resulta mucho mas evidente ahora. Mas aun, las soluciones encontradas por unalgoritmo de el mejor primero como este seran tpicamente no optimas.

Por ultimo, repasando todas las consideraciones realizadas para estos casos, resulta trivial observar que noexiste ningun w > 0 (caso ) para el que resulte un algoritmo admisible que usa una funcion heursticainadmisible.


Como de costumbre, hay varias alternativas para representar cada estado. La mas facil consiste, simplemente,en emplear un vector de posiciones, cada una de las cuales tiene asignada una posicion del tablero, cuyo contenidopodra ser: p, l o 2, representando el vaco. As, por ejemplo, ordenando las casillas del tablero por filas primero,y columnas despues, el estado inicial se describira computacionalmente como sigue: p,2,2, p,2,2,2, l, p,2,2.Existen muchsimos otros formalismos que podran emplearse, pero este, de hecho, sera perfectamente valido.

Para la descripcion de los operadores es preciso distinguir entre los movimientos de los perros y los de las liebres.Para ello, se definen dos operadores diferentes: MoverPerro(x) y MoverLiebre(x) que reciben como argumentola posicion desde la que hay que moverlos. Obviamente, que en esa posicion haya un perro o una liebre, segun elcaso, es una precondicion ineludible. Pero, ademas, es preciso considerar los movimientos legales representados conarcos en el tablero. Por ejemplo, con un perro (p) en la posicion 1 (como ocurre, de hecho, en la situacion inicial),las unicas jugadas legales en MoverPerro(1) deberan ser {2, 5, 6}, dado por supuesto que esas posiciones estenlibres esto es, que ni siquiera este la liebre. Aunque sea poco elegante, la forma mas eficiente de implementar estos

3Solo se ha demostrado que con w = 0 y w = 1, el algoritmo de el mejor primero resultante es admisible si la funcion heursticaque lo gua lo es tambien. Sin embargo, las discusiones presentadas en esta solucion deberan bastar para entender intuitivamente quela misma conclusion se sigue para cualquier valor w [0, 1].

operadores es considerando de forma especfica, casilla por casilla, las posiciones libres adyacentes y devolviendoun conjunto que contiene aquellas que, ademas, estan desocupadas.

Para el diseno de una funcion de evaluacion es necesario identificar la expresion que pretende minimizarse omaximizarse. Por ejemplo, en ajedrez el material podra servir como funcion de evaluacion para un jugador voraz(pero muy poco inteligente, desde luego). En este caso, pueden considerarse diferentes medidas de lo cerca o lejosque estan ambos jugadores de acabar ganando la partida. Por lo tanto, son funciones de evaluacion plausibles lassiguientes:

Podra entenderse que cuanto mas cerca este la liebre del extremo izquierda (casilla 4) del tablero, mas cercaesta de ganar sin ninguna otra consideracion. En ese caso, los perros querran maximizar la distancia de laliebre a su destino, mientras que la liebre querra minimizarla:

f1(x) = Distancia(l , 4 )

Alternativamente, podria entenderse que, puesto que los perros quieren restringir los movimientos de laliebre completamente, el numero de movimientos factibles de la liebre representara esta funcion deevaluacion.

f2(x) = |Movimientos(l)|

Asimismo, podra entenderse que cuantas mas formas tenga la liebre para llegar a su destino, mas posibilidadestendra entonces de ganar la partida puesto que los perros deberan cerrar entonces mas agujeros. Esteconcepto se representara fielmente con el uso de una funcion de evaluacion como la siguiente:

f3(x) = |Caminos(l)|

donde Caminos es una funcion que emplea un algoritmo de busqueda de un agente para contar todas lasformas de llegar hasta el destino. Seras capaz de hacerlo? Que algoritmo elegiras?

Por supuesto, tambien es posible combinar linealmente (o no) estas caractersticas (features, en la bibliografaespecializada) para concederles diferentes importancias. As, son funciones plausibles (pero de un proposito dudoso

en esta ocasion) f1(x) + f2(x) + 3f3(x) of1(x)f2(x)

.

En definitiva, cuanto mayor sea la comprension del juego, mejor resultan las estimaciones de la funcion deevaluacion. En este caso, aun es posible profundizar un poco mas en el juego para advertir lo siguiente:

Los perros ganan solo si encierran a la liebre. Puesto que son tres, solo hay unas pocas casillas con grado 3:2, 8 y 10. En el resto de las posiciones resulta claro que la liebre nunca quedara acorralada.

Por lo tanto, los perros deben forzar a la liebre a ocupar una de estas casillas y, a continuacion, ocupar laultima casilla adyacente a la ocupada recientemente por la liebre, para poder ganar.

Teniendo en cuenta que los perros no pueden capturar en esta version a la liebre, las reglas anteriores (juntocon esta ultima consideracion) se reduce a considerar la paridad/imparidad de las alternativas para la liebrey los perros, esto es:

Si la liebre dispone de movimientos de longitud par/impar para llegar a las casillas 2, 8 o 10. Si los perros disponen de una cantidad de movimientos par/impar para encerrar a la liebre en las mismas

casillas 2, 8 o 10.

Obviamente, si ahora:

Es el turno de la liebre. Para ganar la liebre, necesariamente debe dirigirse a la casilla 2, 8 o 10 a laque pueda llegar en un numero par/impar de movimientos a sabiendas de que los perros no disponende una combinacion de la misma paridad. Si fuera as, entonces, necesariamente, la liebre perdera si yaesta encerrada en una region (por muy grande que sea).

Es el turno de los perros. Aplican las consideraciones estrictamente contrarias que en el caso anterior.

De hecho, considerando ahora esta funcion de evaluacion es facil asignar en cualquier posicion alguno de losvalores {1, 0,+1} si la liebre pierde, empata o gana, respectivamente. Mas aun, es facil, muy facil, demostrar(jugando) que el valor teorico de este juego (o, en otras palabras, el valor minimax ) del arbol de busquedacompletamente desarrollado es 0, esto es, tablas.

0123456789101112

0 5 10 15 20 25 30 35

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bc

bcb

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

b

Figura 4: Distancia Eucldea vs. Distancia de Manhattan en mallas


Para la obtencion de una funcion heurstica, lo mejor es emplear el modelo de relajacion de restricciones queconsiste en simplificar los problemas reales considerando la violacion selectiva de algunas restricciones, de modo que,en el problema resultante (denominado problema relajado) sea posible calcular el coste optimo de las soluciones.El valor heurstico, h(n), de cualquier problema real, n, sera entonces el coste optimo de su version relajada.

En este caso, una restriccion susceptible de ser relajada son los obstaculos. Por lo tanto, relajando estarestriccion, resulta un problema mucho mas sencillo donde, simplemente, no hay obstaculos! En un problemasimplificado de este modo, el coste optimo para llegar desde cualquier casilla P (x, y) hasta el estado final, (5, 0)(considerando que el origen de coordenadas, (0, 0), esta en la casilla inferior izquierda) es la distancia deManhattan, definida como la suma de la diferencia de filas y columnas entre ambas posiciones. Formalmente:dm(P (x, y)) = |x 5|+ |y 0| = |x 5|+ y.

Sin embargo, podra relajarse, ademas, el hecho de que solo es posible transitar a las posiciones horizontal overticalmente adyacentes, despues de haber relajado la presencia de los obstaculos. En este caso, el coste optimodel nuevo problema simplificado es la distancia eucldea o aerea entre P (x, y) y el estado final, (5, 0) definidade la siguiente manera: de(P (x, y)) =

(x 5)2 + (y 0)2 =

(x 5)2 + y2.

Puesto que se dispone de mas de una funcion heurstica, debe elegirse entre una de ellas. Tpicamente, cuando unafuncion heurstica resulta de mas relajaciones que otra, la primera suele ofrecer (evidentemente) peores estimacionesque la segunda. En este caso, la distancia eucldea, de, ha resultado de relajar aun mas restricciones que lasconsideradas para la obtencion de la distancia de Manhattan, dm, por lo que esta ultima debera ser la elegida. Dehecho, resulta muy facil demostrar analticamente que dm de o, en otras palabras, que dm es mas informadaque de. La figura ?? muestra con puntos solidos los valores de la distancia eucldea y con puntos huecos, los valoresde la distancia de Manhattan4. Como puede verse, la distancia de Manhattan es siempre mayor o igual que laeucldea, por lo que sera la que se usara en el resto de este ejercicio.

Antes de resolver los siguientes apartados, sera bueno recordar que el algoritmo de busqueda en escalada(hill-climbing, en ingles) simplemente expande el sucesor con la mejor evaluacion heurstica, de entre los nodos reciengenerados. De hecho, se dice que este algoritmo implementa una poltica irrevocable porque escoge inmediatamenteun sucesor desestimando todos los demas sin hacer ninguna otra consideracion que el valor de la funcion heursticade cada sucesor.

Aunque este algoritmo se implementa frecuentemente sin mantener una lista de todos los nodos visitados, enlos siguientes casos, s se considera que el algoritmo conoce siempre el camino que le ha llevado hasta el desde elnodo raz. Por este motivo, en vez de mostrar un arbol de busqueda explcitamente, se describira el desarrollo delalgoritmo de busqueda dibujando sobre el tablero las casillas visitadas y los valores heursticos de cada sucesor.

Considerando, primero, que los sucesores de cualquier casilla se generan siempre en el orden: {derecha (), abajo(), izquierda (), arriba ()} y que el robot esta inicialmente en (0, 5), el estado inicial se describe simplementepor:

4En esta grafica, las abscisas son el punto (i 6 + j) donde i es la fila y j es la columna

0 1 2 3 4 5 60

1

2

3

4

5

6

x

G

donde la posicion del robot se indica con el smbolo x.Despues de expandir el estado inicial, se originan solo dos estados factibles (puesto que moviendo el robot

en cualquiera de las direcciones o , se exceden los lmites de la habitacion, generando entonces estadosinfactibles) cuyas evaluaciones heursticas son iguales, h(P (1, 4)) = h(P (2, 5)) = 9, puesto que, segun la distanciade Manhattan:

dm(P (0, 4))=|0 5|+ |4 0]=5 + 4=9dm(P (1, 5))=|1 5|+ |5 0]=4 + 5=9

Puesto que el algoritmo de busqueda en escalada unicamente considera los valores de las funciones heursticas,y estas son iguales para los unicos sucesores del estado inicial, la seleccion se resuelve escogiendo el primer nodogenerado que, en la ordenacion que actualmente se esta empleando (, , y ) sera , de modo que el robotpasa a la posicion (1, 5):

0 1 2 3 4 5 60

1

2

3

4

5

6

x

G

x9

9

donde los nuevos sucesores contienen sus valores heursticos en la esquina inferior derecha.Ahora, la expansion del estado actual, (1, 5) genera hasta tres sucesores (despues de deshechar la direccion

que llevara al robot fuera de la habitacion) de los que (0, 5) (al que se llega gracias a la aplicacion del operador )es eliminado, puesto que pertenece al camino desde la raz hasta el estado actual, lo que se indica explcitamenteen el grafico anterior con el mismo smbolo empleado para el robot pero con una grafa mas pequena. Los nuevosestados, (2, 5) y (1, 4) una vez mas, tendran la misma evaluacion, 8:

dm(P (1, 4))=|1 5|+ |4 0]=4 + 4=8dm(P (2, 5))=|2 5|+ |5 0]=3 + 5=8

de modo que se escoge (2, 5), puesto que el operador tiene preferencia sobre , de modo que resulta:

0 1 2 3 4 5 60

1

2

3

4

5

6

x

G

x x9

9

8

8

Nuevamente, el nodo (2, 5) es expandido y hasta dos nuevos sucesores son generados, (2, 4) y (3, 5), cuyos valoresheursticos coinciden:

dm(P (2, 4))=|2 5|+ |4 0]=3 + 4=7dm(P (3, 5))=|3 5|+ |5 0]=2 + 5=7

y aunque, obviamente, la solucion optima desde el estado actual, (2, 5) pasa por el sucesor (2, 4), el algoritmo debusqueda en escalada elegira (3, 5), puesto que el operador tiene preferencia sobre , resultando el estado:

0 1 2 3 4 5 60

1

2

3

4

5

6

x

G

x x x9

9

8

8

7

7

Resulta notable el hecho de que tan pronto como el algoritmo de busqueda en escalada escoge en este punto,el sucesor (3, 5), se olvida inmediatamente de (2, 4). Se dice entonces que el nodo (2, 4) ha sido completamentedesechado y, de hecho, no volvera a ser considerado salvo que, por supuesto, pasemos de nuevo por el nodo, (2, 5).

Es facil ver que en dos pasos mas, el algoritmo de busqueda en escalada llegara exactamente a la posicionsiguiente:

0 1 2 3 4 5 60

1

2

3

4

5

6

x

G

x x x x x9

9

8

8

7

7

6 5

5

Llegados a este punto, la expansion del nodo actual, (5, 5), solo puede producir un estado util, (5, 4) puestoque, como hasta ahora, los operadores y no conducan al robot a posiciones legales y la posicion (4, 5) esta enla lista de posiciones visitadas desde el nodo raz, (0, 5) hasta la posicion actual, (5, 5). Circunstancialmente, lapuntuacion del unico sucesor util del estado actual tiene un valor heurstico (4) aun menor que el valor heursticodel nodo actual (5) pero debe advertirse que el algoritmo de busqueda en escalada lo habra escogido igualmente,por ser la unica alternativa:

0 1 2 3 4 5 60

1

2

3

4

5

6

x

G

x x x x x x9

9

8

8

7

7

6 5

5 4

Como antes, la expansion del nodo actual, (5, 4), solo genera el estado (4, 4). Aunque el valor heurstico de estaposicion es h(4, 4) = dm(P (4, 4)) = 5, mayor que el valor heurstico del nodo actual, h(5, 4) = dm(P (5, 4)) = 4,este sucesor sera irremediablemente escogido por ser la unica alternativa disponible:

0 1 2 3 4 5 60

1

2

3

4

5

6

x

G

x x x x x x

x

9

9

8

8

7

7

6 5

5 4

Notese que, ahora, la expansion del nodo (4, 4) genera solo el estado (4, 3) que, aunque tiene el mismo valorheurstico que la posicion (5, 4) (esto es, h(4, 3) = h(5, 4) = 4), esta ultima es desestimada por formar parte delcamino desde la raz hasta la posicion actual. Con una unica alternativa factible, el algoritmo de busqueda enescalada llega ahora a la siguiente posicion:

0 1 2 3 4 5 60

1

2

3

4

5

6

x

G

x x x x x x

xx

9

9

8

8

7

7

6 5

5 4

4

desde la cual solo es posible llegar a un unico nuevo sucesor con un valor heurstico igual a 5, el estado (3, 3):

0 1 2 3 4 5 60

1

2

3

4

5

6

x

G

x x x x x x

xx

x

9

9

8

8

7

7

6 5

5 4

45

Desde esta posicion es facil ver que el algoritmo de busqueda en escalada llegara en dos pasos a la siguienteposicion:

0 1 2 3 4 5 60

1

2

3

4

5

6

x

G

x x x x x x

xx

xx

x

9

9

8

8

7

7

6 5

5 4

456

45

3

puesto que desde las posiciones (3, 3) y (3, 2), el operador siempre conduce al sucesor con el mejor valor heurstico.Como ocurriera al principio, los sucesores que ahora se generan corresponden unicamente a la aplicacion de los

operadores y , de entre los cuales tiene preferencia, de modo que en solo dos pasos se llega exactamente ala siguiente configuracion:

0 1 2 3 4 5 60

1

2

3

4

5

6

x

G

x x x x x x

xx

xx

x

x x

9

9

8

8

7

7

6 5

5 4

456

45

3 2

2

1

1

Por fin, despues de la expansion del estado actual, (5, 1), se reconoce el estado final, (5, 0), con h(5, 0) =dm(P (5, 0)) = |5 5| + |0 0] = 0. Puesto que el algoritmo de busqueda en escalada se detiene cuando coincideeventualmente con el estado final, el algoritmo acaba en la posicion:

0 1 2 3 4 5 60

1

2

3

4

5

6

G

x x x x x x

xx

xx

x

x x x

9

9

8

8

7

7

6 5

5 4

456

45

3 2

2

1

1

2

0

con la solucion ,,,,, ,, ,, , ,,, Si, en cambio, ahora se considera la ordenacion de operadores siguiente {, , y }, tal y como se sugera en

el tercer apartado, resultara trivial comprobar que el camino explorado por el algoritmo de escalada para encontrarla solucion final es el que se muestra en el cuadro ??. Con el objeto de abreviar la exposicion se muestra, en cadacaso, el estado que resulta antes de aplicar un operador distinto al ultimo. Notese, por ejemplo, como desde elestado (2, 2), el algoritmo escoge el sucesor (3, 2), en vez de (1, 2) puesto que, aunque tiene precedencia sobre, lo cierto es que h(3, 2) = 4 < h(1, 2) = 6. En otras palabras, es importante advertir que la precedencia deoperadores se aplica en caso de empate entre las evaluaciones heursticas.

Por fin, desde el paso , es posible generar en solo dos pasos el estado final siguiendo, simplemente, los sucesorescon la menor puntuacion heurstica:

0 1 2 3 4 5 60

1

2

3

4

5

6

G

x

x x x

x

x x

x

x x

9

9 8 7

8

6 5

56 4

3 2

23 1 0

con la solucion ,,, , ,, , ,, que, de hecho, es la solucion optima, con solo 10 pasos, en vez de los14 pasos de la solucion anterior.

El orden de los operadores ha infludo para la obtencion de una solucion mejor

que la anterior

Y ahora, sera posible generar tambien una buena solucion empleando el algoritmo de busqueda en haz envez de escalada? Generalmente, la respuesta es que s, pero esto depende tambien del valor elegido para k. En el

0 1 2 3 4 5 60

1

2

3

4

5

6

x

G

0 1 2 3 4 5 60

1

2

3

4

5

6

x

G

x9

9

Estado inicial Estado (0, 4)

0 1 2 3 4 5 60

1

2

3

4

5

6

x

G

x

x x

9

9 8 7

0 1 2 3 4 5 60

1

2

3

4

5

6

x

G

x

x x x

x

9

9 8 7

8

6 5

5

Estado (2, 4) Estado (2, 2)

0 1 2 3 4 5 60

1

2

3

4

5

6

x

G

x

x x x

x

x

9

9 8 7

8

6 5

56 4

0 1 2 3 4 5 60

1

2

3

4

5

6

x G

x

x x x

x

x x

x

9

9 8 7

8

6 5

56 4

3 2

2

Estado (3, 2) Estado (3, 0)

Cuadro 2: Algoritmo de busqueda en escalada con la ordenacion {, , y }

cuarto apartado se sugiere intentar resolver el problema con la primera ordenacion de nodos, {, , , } (parala que el algoritmo de busqueda en escalada no encontro la solucion optima), con k = 3, esto es, manteniendoconstantemente las k = 3 mejores alternativas en una lista denominada abierta.

En este caso, puesto que es preciso examinar simultaneamente hasta k alternativas diferentes, se usara un arbolde busqueda para describir explcitamente el comportamiento de este algoritmo. En las descripciones que siguen,cada estado se representa como un par (x, y) que indica la posicion actual del robot y que es relativo al origen decoordenadas arbitrariamente situado en la casilla inferior izquierda. Como antes, la funcion heurstica empleadasera la distancia de Manhattan, dm. Por lo tanto, para encontrar el mejor camino desde el estado inicial, (0, 5),hasta el estado final, (5, 0), usando la distancia de Manhattan, se tiene que, despues de la expansion del nodo inicialresultaran solo dos descendientes:

(0, 5)h = 10

(1, 5)h = 9

1

(0, 4)h = 9

2

donde los sucesores han sido generados, efectivamente, con la ordenacion sugerida: {, ,, }. Despues de insertarlos nuevos sucesores, (1, 5) y (0, 4) en la lista abierta y ordenarlos, se escogen los k = 3 mejores descendientes.Esto es, la lista de sucesores a expandir resulta inalterada puesto que solo hay 2 < k = 3 nodos que, a continuacion,son expandidos simultaneamente como sigue:

(0, 5)h = 10

(1, 5)h = 9

(2, 5)h = 8

1

(1, 4)h = 8

2

(0, 4)h = 9

(1, 4)h = 8

2

Por supuesto, al insertar los nuevos descendientes en la lista abierta, se encuentra que el nodo (1, 4) es generadopor dos caminos diferentes: , y , pero, evidentemente, es insertado una unica vez, puesto que siempretienen la misma puntuacion5 h(1, 4), = h(1, 4), = 8. Este hecho se marca explcitamente en todos los arbolesde busqueda mostrando los nodos repetidos (denominados en la bibliografa especializada como transposiciones)en una caja punteada.

Por lo tanto, una vez mas, se tienen solo dos nodos utiles de modo que la lista de sucesores resulta inalteradacon k = 3. Despues de expandirlos resulta:

5Debe advertirse, en relacion con otros algoritmos que empleen el valor de g(n), como el A o el IDA, que en esos casos s quepuede ocurrir que sea preciso distinguir entre caminos que llevan hasta un mismo nodo, puesto que en un caso podran encontrarsecaminos mas economicos que otros.

(0, 5)h = 10

(1, 5)h = 9

(2, 5)h = 8

(3, 5)h = 7

1

(2, 4)h = 7

2

(1, 4)h = 8

(2, 4)h = 7

2

(0, 4)h = 9

De nuevo, se genera el mismo nodo (2, 4) por dos caminos diferentes que, sin embargo, no se distinguen en elcalculo de la nueva lista abierta que, por lo tanto, contendra unicamente los nodos (3, 5) y (2, 4) con la mismapuntuacion h( ) = 7. A continuacion, vuelven a expandirse hasta los mejores k = 3 nodos en abierta que, sinembargo, seran solo dos:

(0, 5)h = 10

(1, 5)h = 9

(2, 5)h = 8

(3, 5)h = 7

(4, 5)h = 6

1

(2, 4)h = 7

(2, 3)h = 6

2

(1, 4)h = 8

(0, 4)h = 9

Este es un buen momento para advertir el efecto del algoritmo de busqueda en haz. Comparandolo conel algoritmo de busqueda en escalada que se empleo anteriormente, resulta ahora muy facil advertir (inclusograficamente), que el algoritmo de busqueda en haz esta manteniendo simultaneamente las dos mejores alternativasque hay, en la forma de caminos generados al mismo tiempo desde el nodo raz. Ambas alternativas son, sobre lahabitacion, las siguientes:

0 1 2 3 4 5 60

1

2

3

4

5

6

x

G

xx x x x

x x x

9

9 8

8

7

7

6

6

De nuevo, al expandir las k = 2 mejores alternativas se tiene:

(0, 5)h = 10

(1, 5)h = 9

(2, 5)h = 8

(3, 5)h = 7

(4, 5)h = 6

(5, 5)h = 5

1

(4, 4)h = 5

2

(2, 4)h = 7

(2, 3)h = 6

(3, 3)h = 5

3

(2, 2)h = 5

4

(1, 4)h = 8

(0, 4)h = 9

La ordenacion en abierta mostrada con los numeros debajo de cada nodo resulta de la ordenacion de losoperadores considerada en esta parte del ejercicio. Observese que las dos primeras alternativas (esto es, (5, 5) y(4, 4)) se refieren a caminos que llevan a soluciones suboptimas puesto que la solucion optima para llegar a (0, 5)no pasa en absoluto por (4, 5). Afortunadamente, usando k = 3 se dejara en abierta uno de los sucesores quepasan por (2, 3). Por lo tanto, despues de ordenar los nodos en abierta se expandiran todos menos el ultimo, (2, 2):

(0, 5)h = 10

(1, 5)h = 9

(2, 5)h = 8

(3, 5)h = 7

(4, 5)h = 6

(5, 5)h = 5

(5, 4)h = 4

1

(4, 4)h = 5

(5, 4)h = 4

1

(4, 3)h = 4

2

(2, 4)h = 7

(2, 3)h = 6

(3, 3)h = 5

(4, 3)h = 4

2

(3, 2)h = 4

3

(2, 2)h = 5

(1, 4)h = 8

(0, 4)h = 9

Como antes, el algoritmo de busqueda en haz escogera ahora arbitrariamente entre cualesquiera de los nodosrepetidos para continuar a partir de ellos, siempre que esten entre los k = 3 mejores nodos. En este caso, todos losnodos recien generados seran expandidos puesto que se tienen, exactamente, hasta k = 3 nuevos sucesores distintos:

(0, 5)h = 10

(1, 5)h = 9

(2, 5)h = 8

(3, 5)h = 7

(4, 5)h = 6

(5, 5)h = 5

(5, 4)h = 4

(4, 4)h = 5

2

(4, 4)h = 5

(5, 4)h = 4

(4, 3)h = 4

(3, 3)h = 5

3

(2, 4)h = 7

(2, 3)h = 6

(3, 3)h = 5

(4, 3)h = 4

(3, 2)h = 4

(3, 1)h = 3

1

(2, 2)h = 5

4

(2, 2)h = 5

(1, 4)h = 8

(0, 4)h = 9

Debe advertirse que el algoritmo de busqueda en haz esta, de hecho, revisitando los mismos nodos en algunasocasiones. Por ejemplo, puesto que se eligio el nodo (5, 4) mas a la izquierda, su sucesor, (4, 4), es generado puestoque no estaba en el conjunto de antecesores de su padre, aunque s que lo estaba en el conjunto de antecesoresdel otro nodo (5, 4). En cualquier caso, de nuevo vuelven a expandirse las k = 3 mejores alternativas, lo que dejafuera de toda consideracion al nodo (2, 2)

(0, 5)h = 10

(1, 5)h = 9

(2, 5)h = 8

(3, 5)h = 7

(4, 5)h = 6

(5, 5)h = 5

(5, 4)h = 4

(4, 4)h = 5

(4, 3)h = 4

3

(4, 4)h = 5

(5, 4)h = 4

(4, 3)h = 4

(3, 3)h = 5

(3, 2)h = 4

4

(2, 3)h = 6

5

(2, 4)h = 7

(2, 3)h = 6

(3, 3)h = 5

(4, 3)h = 4

(3, 2)h = 4

(3, 1)h = 3

(4, 1)h = 2

1

(3, 0)h = 2

2

(2, 2)h = 5

(2, 2)h = 5

(1, 4)h = 8

(0, 4)h = 9

En este momento, el algoritmo de busqueda en haz esta exhibiendo toda su capacidad para examinar simultaneamenteuna gran cantidad de caminos hasta cinco, en esta iteracion. Puesto que la seleccion del parametro k ha sidoafortunada, se expandiran los nodos (4, 1) y (3, 0) ademas del nodo (3, 3) que, de hecho, llevan a la solucionpor caminos optimos:

(0, 5)h = 10

(1, 5)h = 9

(2, 5)h = 8

(3, 5)h = 7

(4, 5)h = 6

(5, 5)h = 5

(5, 4)h = 4

(4, 4)h = 5

(4, 3)h = 4

(3, 3)h = 5

4

(4, 4)h = 5

(5, 4)h = 4

(4, 3)h = 4

(3, 3)h = 5

(3, 2)h = 4

(2, 3)h = 6

(2, 4)h = 7

(2, 3)h = 6

(3, 3)h = 5

(4, 3)h = 4

(3, 2)h = 4

(3, 1)h = 3

(4, 1)h = 2

(5, 1)h = 1

1

(4, 0)h = 1

2

(3, 0)h = 2

(4, 0)h = 1

2

(2, 0)h = 3

3

(2, 2)h = 5

(2, 2)h = 5

(1, 4)h = 8

(0, 4)h = 9

Efectivamente, entre las k = 3 mejores alternativas, se encuentran cualesquiera de los caminos que superaron elpunto (3, 2) esto es, todos los nuevos nodos generados menos (3, 3) que sigue persistentemente buscando nuevoscaminos por la mitad superior de la habitacion. Expandiendo ahora tanto (5, 1) como (4, 0) se llega finalmente alestado meta. Puesto que el primer nodo en expandir sera (5, 1), la solucion encontrada por el algoritmo de busquedaen haz con el uso de una ordenacion de nodos que no sirvio para encontrar la solucion optima conescalada es: ,, , ,, , ,,,

La expansion simultanea de un numero determinado de nodos en abierta ha

servido para encontrar la solucion optima


Este problema discute la aplicacion de algoritmos de busqueda al caso de la busqueda en grafos con eluso de funciones heursticas admisibles. Seras capaz de explicar por que la funcion heurstica del problema esefectivamente admisible?

Escalada

El algoritmo de busqueda en escalada elegira, en cada paso, el nodo mas prometedor considerando para ello,unicamente, el valor de la funcion heurstica h( ). Se dice que el algoritmo de busqueda en escalada es un algoritmoque implementa una poltica irrevocable porque, despues de cada expansion, escoge un unico sucesor (resolviendolos empates en favor del nodo mas a la izquierda) y prosigue por el, desechando inmediatamente el resto.

Para mostrar su comportamiento, considerese el grafo del enunciado. En las figuras que siguen, se ha consideradoque los nodos se generan en orden lexicografico. Naturalmente, cada arco del arbol de busqueda desarrollado encada caso estara etiquetado con el coste que tiene en el grafo del enunciado.

Despues de la expansion del nodo inicial, S, se tiene:

S

g = 0h = 8

C

g = 3h = 5

1

3

E

g = 2h = 6

2

2

F

g = 1h = 6

3

1

de modo que, obviamente, el mejor nodo heursticamente hablando sera C, luego E y, por ultimo, F, tal y comose indica en la figura anterior. Se procede, por lo tanto, a la expansion del nodo C resultando:

S

g = 0h = 8

C

g = 3h = 5

3

A

g = 4h = 2

1

1

B

g = 6h = 3

2

3

E

g = 8h = 6

3

5

E

g = 2h = 6

2

F

g = 1h = 6

1

Observese como el arbol de busqueda ha encontrado una segunda forma de llegar al nodo E, a traves del nodoC. Sin embargo, esta segunda manera es, efectivamente, mas cara y, de hecho, el algoritmo no la considerara puestoque existe otra alternativa heursticamente mas barata: el nodo A.

Sg = 0h = 8

C

g = 3h = 5

3

A

g = 4h = 2

1

B

g = 5h = 3

2

1

G

g = 11h = 0

1

7

B

g = 6h = 3

3

E

g = 8h = 6

5

E

g = 2h = 6

2

F

g = 1h = 6

1

Por fin, se encuentra eventualmente la meta, el nodo G, y el algoritmo termina con la solucion S,C,A,G conun coste igual a g(G) = 11 unidades.

A

A diferencia del algoritmo de escalada, el algoritmo A tendra en cuenta el coste, g( ), para llegar a cada nodo yordenara todas las alternativas disponibles en una lista abierta ascendentemente por el valor f(n) = g(n) + h(n).Puesto que el algoritmo se detiene cuando procede a expandir la meta (en vez de cuando la genera), puede asegurarseque el algoritmo A terminara con la solucion optima si la funcion heurstica que lo gua es admisible. Ademas, paraevitar expandir el nodo varias veces, el algoritmo A mantiene en una lista cerrada todos los nodos expandidoshasta el momento. Asi, basta con comprobar antes de la expansion de un nodo que este no se encuentra en la listacerrada porque si es as, entonces ya ha sido visitado con anterioridad y puede ahorrarse esta expansion.

A proposito de esta cuestion, puede asegurarse que el algoritmo de busqueda en escalada nunca expandira dosveces el mismo nodo?

En el caso del enunciado, despues de expandir el nodo inicial, S queda6:

S

C

(8;2)

3

E

(8;3)

2

F

(7;1)

1

Notese como, ahora, el nodo preferible resulta ser F, en vez de C, que fue el nodo escogido por escalada.El motivo es que el algoritmo A tiene en cuenta, ademas, el esfuerzo para llegar a cada nodo, de modo quef(C) = g(C) + h(C) = 8 > 7 = f(F) = g(F) + h(F). Por lo tanto, expandiendo el nodo F se tiene:

S

C

(8;1)

3

E

(8;2)

2

F

1

B

(9;3)

5

D

(9;4)

4

Resolviendo, como siempre, los empates en favor del nodo mas a la izquierda, el mejor descendiente es el nodoC:

6Por motivos de espacio, los nodos se representan ahora, unicamente, con su letra y debajo se indican su valor de f( ) y el ordenque ocupan en abierta entre parentesis

SC

3

A

(6;1)

1

B

(9;3)

3

E

(14;6)

5

E

(8;2)

2

F

1

B

(9;4)

5

D

(9;5)

4

Algunos podran pensar que un refinamiento de la codificacion del algoritmo A consiste en no introducir elnodo E en abierta que se acaba de generar, puesto que tiene una evaluacion f(E) = 14 unidades, notablementesuperior que las 8 unidades con que haba sido generado hace dos pasos. Sin embargo, ello nos obligara a revisarla lista abierta cada vez que se quiere introducir algo en ella. En su lugar, es mas facil insertar el nuevo nodo enabierta sin comprobar si esta o no repetido. Cuando se expanda la primera copia del nodo E (que necesariamentelo hara antes que esta, puesto que tiene 8 unidades de coste, menor que las 14 de esta segunda), este pasara acerrada, de modo que no se expandira la segunda7.

Como quiera que ocurriera con el algoritmo de escalada, sera nuevamente el nodo A el que primero genere lameta, G, puesto que f(A) es la menor de las evaluaciones de la lista abierta que ahora se tiene cuyos contenidosordenados son: {A, E, B, B, D, E}

S

C

3

A

1

B

(8;1)

1

G

(11;6)

7

B

(9;3)

3

E

(14;7)

5

E

(8;2)

2

F

1

B

(9;4)

5

D

(9;5)

4

Resulta notable advertir ahora que el algoritmo A ha descubierto que para llegar al nodo B, lo mas barato eshacerlo por el camino S,C,A,B que por cualesquiera de las otras alternativas que, aunque consisten en menosnodos, tienen un coste g( ) mayor.

Notese, ademas, que aunque se ha generado la meta, G, el algoritmo no se detiene puesto que aun existen variasoportunidades de llegar al mismo nodo final a traves de otros caminos mas baratos. Por ejemplo, quien sabe siahora expandiendo el primer nodo en abierta, el nodo B, resulta que llegamos de un solo golpe al nodo G con uncoste menor a 11 unidades? Solo hay una forma de averiguarlo, expandiendolo:

S

C

3

A

1

B

1

D

(11; 6)

2

F

(16; 9)

5

Z

(9; 2)

3

G

(11; 7)

7

B

(9; 3)

3

E

(14; 8)

5

E

(8; 1)

2

F

1

B

(9; 4)

5

D

(9; 5)

4

Puesto que todos los nodos recien generados superan el valor del nodo E al que se llega directamente desde laraz, este se convierte en el primero en abierta y, despues de su expansion resulta:

7El mismo comentario aplica a la segunda copia que ahora se ha generado del nodo B, solo que, en este caso, la nueva es masbarata que la anterior!

SC

3

A

1

B

1

D

(11; 5)

2

F

(16; 9)

5

Z

(9; 1)

3

G

(11; 6)

7

B

(9; 2)

3

E

(14; 8)

5

E

2

C

(12; 7)

5

F

1

B

(9; 3)

5

D

(9; 4)

4

Convendra entender bien como se ha ordenado incrementalmente la lista abierta y los efectos que origina suuso. Para entenderlo mejor se muestran a continuacion los contenidos de abierta en este mismo instante:

Posicion Contenido f( )

S,C,A,B,Z 9 S,C,B 9 S,F,B 9 S,F,D 9 S,C,A,B,D 11 S,C,A,G 11 S,E,C 12 S,C,E 14 S,C,A,B,F 16

Como puede verse, el primer nodo en abierta tiene siempre la menor de las puntuaciones f( ) o, en otraspalabras, es la mejor de las alternativas disponibles. Conviene recordar, asimismo, que los empates se resuelvensiempre a favor del nodo mas a la izquierda o, en otras palabras, en favor del nodo que se encontrara antes en unrecorrido en profundidad. Sin embargo, la observacion mas importante es que la lista abierta almacena caminosy no nodos (a pesar de que con frecuencia se diga as). Por ello, si se genera el mismo nodo mas de una vez, este esinsertado igualmente. Obviamente las copias de cualquier nodo que ya ha sido expandido, no se expandiran nuncapuesto que el nodo del que son copia ya estara entonces en la lista cerrada.

Por lo tanto, ahora se expande el primer nodo, el nodo Z:

S

C

3

A

1

B

1

D

(11; 5)

2

F

(16; 9)

5

Z

3

D

(16; 10)

G

(9; 1)

G

(11; 6)

7

B

(9; 2)

3

E

(14; 8)

5

E

2

C

(12; 7)

5

F

1

B

(9; 3)

5

D

(9; 4)

4

Por segunda vez se ha generado el nodo final, G! pero esta vez con un valor de f( ), 9, mejor que el que tenaantes, 11, de modo que el nuevo camino se situa en abierta por delante y, de hecho, se coloca en primera posicion.Por lo tanto, al escoger ahora el primer nodo en abierta para su expansion, se advierte que se trata del nodo finalo meta y, por lo tanto, se acaba la busqueda con una solucion optima: S,C,A,B,Z,G con un coste de 9 unidades,mejor que la solucion encontrada por el algoritmo de busqueda en escalada.

IDA

El algoritmo IDA, a diferencia del A expande en profundidad el arbol de busqueda desde S hasta que el valorf( ) de sus nodos hoja exceden, por primera vez, un umbral . Para garantizar la admisibilidad del algoritmo, elvalor del umbral se inicializa a 1 = h(S) = 8.

Iteracion 1: 1 = 8

S

C

3

A

1

B

1

D

(11; 5)

2

F

(16; 9)

5

Z

(9; 1)

3

G

(11; 6)

7

B

(9; 2)

3

E

(14; 8)

5

E

2

C

(12; 7)

5

F

1

B

(9; 3)

5

D

(9; 4)

4

Puesto que este arbol se genera en profundidad, la ocupacion de memoria sera lineal y, en un solo paso se hallegado al mismo arbol de busqueda que desarrollo el A en 6 iteraciones y, ademas, con ocupacion de memoriaexponencial.

Como quiera que en esta iteracion no se ha encontrado la meta, G, sera preciso desarrollar otra iteracion perocon un umbral distinto. Para garantizar, de nuevo, la admisibilidad del algoritmo, se toma como nuevo lmite elmnimo exceso en f( ) cometido por todos los nodos hoja generados en esta iteracion8:

2=mn{f(Z), f(B), f(B), f(D), f(D), f(G), f(C), f(E), f(F)}=mn{9, 9, 9, 9, 11, 11, 12, 14, 16}=9

Iteracion 2: 2 = 9

En esta iteracion, el algoritmo IDA generara, nuevamente (desde el principio!), el arbol de busqueda que seobtiene al expandir todos los nodos cuyo valor f( ) no excede el nuevo umbral, 2 = 9. De esta suerte, resulta obvioque se encontraran todos los caminos que pueden desarrollarse con un coste menor o igual a 9 unidades puestoque no expandiran los nodos con un valor f(n) = g(n) + h(n) mayor.

Al hacerlo generara, exactamente, el mismo arbol de la ultima iteracion del A, puesto que se detendra encuanto genera por primera vez el nodo final o meta, G. Puesto que el nodo G tiene ahora un coste menor oigual que el umbral empleado en esta iteracion, puede asegurarse que el camino encontrado es, entonces, optimo:S,C,A,B,Z,G, con un coste de 9 unidades.


En vez de considerar la forma de alcanzar un unico estado inicial, s, a partir de un numero cualquiera de estadosfinales o meta, : {t1, t2, . . . , tn}, considerese primero el caso mas simple: desde un unico estado final. Por ejemplo,desde el t1.

Aplicando el algoritmo A, basta con iniciar la lista abierta con el nodo t1 hasta que finalmente se encuentreel nodo inicial, s. Puesto que el enunciado advierte que solo debe considerarse el caso de grafos no dirigidos, esobvio que puede realizarse la busqueda hacia atras de esta forma sin problemas porque en los grafos no dirigidoses posible transitar desde un estado a otro adyacente en cualquier sentido.

Puesto que el algoritmo A se detiene cuando va a expandir la solucion (en este caso, el nodo inicial), se sabeque esta tiene el coste optimo, independientemente del resto de alternativas que aun queden pendientes de expandiren la lista abierta. Por lo tanto, sera posible popular inicialmente la lista abierta con un conjunto arbitrario denodos meta, ti y ejecutar normalmente el algoritmo A

a continuacion: en cada paso se tomara el primer nodo de

8Se advierte, nuevamente, que cada nodo que aparece en la siguiente expresion representa, en realidad, caminos diferentes que llevanhasta cada uno de ellos

abierta, al que se habra llegado desde alguno de los nodos meta ti, y se evaluara tomando como valor heursticola estimacion hasta llegar al nodo inicial (de modo que, como requera el enunciado, no es necesario reformular lafuncion heurstica), y as sucesivamente, hasta que por fin se va a expandir el nodo s.

La solucion al problema consiste, por lo tanto, en dos observaciones:

Si el espacio de estados es un grafo no dirigido, el algoritmo A puede expandir tambien el arbol de busquedahacia atras: desde una meta cualquiera, ti hasta el nodo inicial, s.

Si se popula la lista abierta con un numero arbitrario de nodos, el A termina con el camino optimo (dadoque la funcion heurstica sea admisible) hasta la solucion desde uno cualquiera de ellos.

file

Documents