Download - Cápitulo 6
![Page 1: Cápitulo 6](https://reader035.vdocuments.pub/reader035/viewer/2022062802/568144c3550346895db18c9e/html5/thumbnails/1.jpg)
1
Cápitulo 6
BUSQUEDA EN JUEGOS DE ADVERSARIO
Sección 1-4
![Page 2: Cápitulo 6](https://reader035.vdocuments.pub/reader035/viewer/2022062802/568144c3550346895db18c9e/html5/thumbnails/2.jpg)
2
Bosquejo
• Las decisiones óptimas• Poda α-β • Las decisiones imperfectas de tiempo real
![Page 3: Cápitulo 6](https://reader035.vdocuments.pub/reader035/viewer/2022062802/568144c3550346895db18c9e/html5/thumbnails/3.jpg)
3
Juegos vs. Búsqueda
• Adversario “imprevisible” especificar un movimiento para cada respuesta posible del adversario
• Límite de tiempo improbable encontrar meta, deben aproximarse
![Page 4: Cápitulo 6](https://reader035.vdocuments.pub/reader035/viewer/2022062802/568144c3550346895db18c9e/html5/thumbnails/4.jpg)
4
Arbol de juego (2 jugadores, deterministas, turnos)
![Page 5: Cápitulo 6](https://reader035.vdocuments.pub/reader035/viewer/2022062802/568144c3550346895db18c9e/html5/thumbnails/5.jpg)
5
Minimax• Jugada perfecta para juegos determinísticos• Idea: mover a la posición con mayor valor minimax
= Mejor ganancia vs. mejor jugada• E. g. Explorando a profundidad 2
![Page 6: Cápitulo 6](https://reader035.vdocuments.pub/reader035/viewer/2022062802/568144c3550346895db18c9e/html5/thumbnails/6.jpg)
6
Algoritmo Minimax
![Page 7: Cápitulo 6](https://reader035.vdocuments.pub/reader035/viewer/2022062802/568144c3550346895db18c9e/html5/thumbnails/7.jpg)
7
Propiedades de minimax
• ¿Completa? Sí (si el árbol es finito)• ¿Óptimo? Sí (en contra de un adversario
óptimo)• ¿Complejidad en Tiempo? O(bm)• ¿Complejidad en espacio? O(bm) DFS
• Para el ajedrez, b ≈ 35, m ≈100, para juegos "razonables“. Solución exacta no factible.
![Page 8: Cápitulo 6](https://reader035.vdocuments.pub/reader035/viewer/2022062802/568144c3550346895db18c9e/html5/thumbnails/8.jpg)
8
Ejemplo de α-β
![Page 9: Cápitulo 6](https://reader035.vdocuments.pub/reader035/viewer/2022062802/568144c3550346895db18c9e/html5/thumbnails/9.jpg)
9
Ejemplo de α-β
![Page 10: Cápitulo 6](https://reader035.vdocuments.pub/reader035/viewer/2022062802/568144c3550346895db18c9e/html5/thumbnails/10.jpg)
10
Ejemplo de α-β
![Page 11: Cápitulo 6](https://reader035.vdocuments.pub/reader035/viewer/2022062802/568144c3550346895db18c9e/html5/thumbnails/11.jpg)
11
Ejemplo de α-β
![Page 12: Cápitulo 6](https://reader035.vdocuments.pub/reader035/viewer/2022062802/568144c3550346895db18c9e/html5/thumbnails/12.jpg)
12
Ejemplo de α-β
![Page 13: Cápitulo 6](https://reader035.vdocuments.pub/reader035/viewer/2022062802/568144c3550346895db18c9e/html5/thumbnails/13.jpg)
13
Propiedades de α-β
• La poda no afecta el resultado final
• Un buen orden de movimientos mejora la efectividad de poda
Orden perfecto. Complejidad en tiempo = O(bm/2) duplica la profundidad de búsqueda
• Un ejemplo simple del valor de razonamiento donde las computaciones tienen importancia (una forma de metarazonamiento)
![Page 14: Cápitulo 6](https://reader035.vdocuments.pub/reader035/viewer/2022062802/568144c3550346895db18c9e/html5/thumbnails/14.jpg)
14
¿Por que α-β?
• α es el valor de la mejor elección (el valor más alto) encontrada hasta ahora en cualquier punto a lo largo del camino hacia max
• Si v es peor que α, max lo evitará poda esa rama
• β semejante para min
![Page 15: Cápitulo 6](https://reader035.vdocuments.pub/reader035/viewer/2022062802/568144c3550346895db18c9e/html5/thumbnails/15.jpg)
15
Algoritmo α-β
![Page 16: Cápitulo 6](https://reader035.vdocuments.pub/reader035/viewer/2022062802/568144c3550346895db18c9e/html5/thumbnails/16.jpg)
16
Algoritmo α-β
![Page 17: Cápitulo 6](https://reader035.vdocuments.pub/reader035/viewer/2022062802/568144c3550346895db18c9e/html5/thumbnails/17.jpg)
17
Recursos Limitados
Tenemos 100 s, explorar 104 nodos/s 106 nodos por movimiento
método estándar:• Prueba de truncamiento:
v.g., Límite de profundidad• La función de evaluación
= estimar la conveniencia de la posición
![Page 18: Cápitulo 6](https://reader035.vdocuments.pub/reader035/viewer/2022062802/568144c3550346895db18c9e/html5/thumbnails/18.jpg)
18
Funciones de evaluación
• Para el ajedrez, típicamente la suma ponderada lineal de características
Eval(s) = w1 f1(s) + w2 f2(s) + … + wn fn(s)
w1 = 9 con
f1(s) = (el número de reinas blancas) – (el número de reinas negras)
etc.
![Page 19: Cápitulo 6](https://reader035.vdocuments.pub/reader035/viewer/2022062802/568144c3550346895db18c9e/html5/thumbnails/19.jpg)
19
Recortando la búsqueda
MinimaxCutoff es idéntico a MinimaxValue excepto1. Terminal? es remplazada por Cutoff?2. Utility es remplazada por Eval
Funciona en la práctica?bm = 106, b=35 m=4
Adelantarse 4 jugadas jugador pésimo!– 4-ply ≈ Principiante humano– 8-ply ≈ PC típica, maestro humano– 12-ply ≈ Deep Blue, Kasparov
![Page 20: Cápitulo 6](https://reader035.vdocuments.pub/reader035/viewer/2022062802/568144c3550346895db18c9e/html5/thumbnails/20.jpg)
20
Juegos Determinísticos
• Damas: Chinook acabó reinado de 40 años de campeón mundial Marion Tinsley en 1994. Usaba una base de datos precomputada de finales perfectos para 8 o menos piezas. Un total de 444 billones de posiciones.
• Ajedrez: Deep Blue derrotó al campeón mundial Garry Kasparov en seis juegos en 1997. Deep Blue registra 200 millones de posiciones por segundo. Evaluación muy sofisticada, y métodos sin revelar para explorar hasta 40 jugadas adelante.
• Othello: Los campeones humanos se reúsan a jugar en contra de computadoras. Son demasiado buenas.
• Go: Los campeones humanos se reúsan a jugar contra computadoras. Son demasiados malas. En Go, b > 300, la mayoría de programas usan bases de
conocimiento de patrones para sugerir movimientos aparentemente buenos.
![Page 21: Cápitulo 6](https://reader035.vdocuments.pub/reader035/viewer/2022062802/568144c3550346895db18c9e/html5/thumbnails/21.jpg)
21
Resumen
• ¡Los juegos son divertidos !• Ilustran varias puntos importantes acerca
de IA• La perfección es inalcanzable debe
aproximarse