agents logiques chap. 7. plan agents basés sur des connaissances le monde de wumpus logique en...

Agents Logiques

Chap. 7

Plan

• Agents basés sur des connaissances• Le monde de Wumpus• Logique en général – modèle et entraînement

(entailment)• Logique propositionnelle (booléenne)• Equivalence, validité, satisfiabilité• Règles d’inférence et preuve de théorème

– Chaînage avant– Chaînage arrière – Règle de Résolution

Base de connaissances

• Base de connaissances = ensemble de phrases dans un langage formel

• Approche déclarative pour construire un agent (ou un système) :– Tell: lui dire ce qu’il doit savoir(Approche procédurale: dire comment faire – étape par étape)

• Ensuite, il peut se demander (Ask) ce qu’il a à faire – les réponses doivent suivre la KB (conséquence logique)

• On peut voir un agent selon son niveau de connaissances• i.e., ce qu’ils savent, indépendamment de comment c’est implanté

• Ou au niveau d’implantation– i.e., structures de données dans la KB et algorithmes pour les manipuler

An agent simple basé sur connaissances

• L’agent doit être capable de:– Représenter les états, les actions, etc. (un formalisme de représentation)– Intégrer de nouvelles perceptions– Mettre à jour la représentation du monde (modifier KB)– Déduire des propriétés cachées du monde (conséquences)– Déduire des actions appropriées (prendre des décisions – conséquences)

Description de PEAS dans le monde de Wumpus

• Mesure de performance– Or+1000, mort -1000– -1 par étape, -10 pour utiliser la flèche

• Environnement– Objets: wumpus, agent, fosses, or– Carrés adjacents au wumpus sentent fort (smelly)– Carrés adjacents à une fosse sentent du brises (breezy)– On voit briller (Glitter) ssi l’or est dans le carré– Tirer (Shooting) tue le wumpus si on est face à – Tirer utilise la seule flèche disponible– Saisir (Grabbing) prend l’or si dans le même carré– Relâcher (Releasing) laisse l’or dans le carré

• Senseurs: Puanteur (Stench), Brise (Breeze), Éclat (Glitter), Coup (Bump), Cri (Scream)

• Actuateurs: Left turn, Right turn, Forward, Grab, Release, Shoot

Caractéristiques du monde de Wumpus

• Observable complètement Non – seulement des perceptions locales

• Déterministe Oui – Le résultat spécifié exactement• Épisodique Non – séquentielle au niveau d’actions• Statique Oui – Wumpus et fosses ne bougent pas• Discret Oui• Seul-agent? Oui – Wumpus est le seul agent qui agit

dans l’environnement

Explorer le monde de wumpus

Logique en général• Les logiques sont des langages formels pour représenter des

informations tel que des conclusions peuvent être tirées.• La syntaxe définit les règles pour écrire des phrases du langage• La sémantique définit le “sens” des phrases

– i.e., définit la vérité d’une phrase dans un monde

• E.g., le langage d’arithmétique– x+2 ≥ y est une phrase; x2+y > {} n’est pas une phrase– x+2 ≥ y est vrai ssi le nombrer x+2 n’est pas plus petit que y– x+2 ≥ y est vrai dans un monde où x = 7, y = 1– x+2 ≥ y est faux dans in monde où x = 0, y = 6

• E.g. le français– « Mets est une dans » n’est pas une phrase– « Je mange une pomme » est une phrase– « Je me promène » n’est pas vrai maintenant– « Je donne un cours » est vrai

Entraînement/Implication (Entailment)

• Entraînement signifie qu’une chose suit sémantiquement une autre (╞ ):

KB ╞ α• La base de connaissances KB entraîne la phrase α ssi α

est vrai dans tous les mondes où KB est vrai

– E.g., la KB contenant“the Giants won” et “the Reds won” entraîne “Either the Giants won or the Reds won”

– E.g., x+y = 4 entraîne 4 = x+y

– L’entraînement est une relation entre des phrases (i.e., une relation syntaxique) qui est basée sur la sémantique• On ne peut pas créer cette relation n’importe comment• E.g. x+y = 4 ╞ x-y = 4 ne doit pas être créée.

Modèle• Les logiciens pensent typiquement en terme de modèles, qui sont

des mondes structurés formellement, par rapport auxquels la vérité est évaluée.

• On dit que m est un modèle d’une phrase α si α est vrai dans m

M(α) est l’ensemble de modèles de α•

On note KB ╞ α ssi M(KB) M(α)•

– E.g. KB = Giants won and Red won – α = Giants won

Entraînement dans le monde de wumpus

Situation après avoir rien détecté dans [1,1], bougé à droite et senti la brise à [2,1]

Considérer les modèles possibles pour KB en supposant il y a seulement des puits

3 choix booléens 8 modèles possibles

Modèles Wumpus(mondes possibles)

Modèles Wumpus

• KB = règles du monde wumpus + observations

Modèles Wumpus

• KB = règles du monde wumpus + observations• α1 = "[1,2] est sécuritaire", KB ╞ α1, prouvé par model

checking

Modèles Wumpus

• KB = règles du monde wumpus + observations

Modèles Wumpus

• KB = règles du monde wumpus + observations• α2 = "[2,2] est sécuritaire", KB ╞ α2

Inférence

• KB ├i α = la phrase α peut être dérivée de KB par une procédure i

• Adéquation (Soundness): i est adéquate si quand KB ├i

α est vrai, KB╞ α l’est aussi.• Complétude (Completeness): i est complète si quand

KB╞ α est vrai, KB ├i α l’est aussi• À venir: nous allons définir une logique (logique du premier ordre)

qui est suffisamment expressive pour exprimer presque tout ce qu’on veut exprimer, et pour laquelle il existe une procédure d’inférence à la fois adéquate et complète.

• C’est-à-dire, la procédure peut répondre à toute question dont la réponse suit logiquement KB

Logique propositionnelle: Syntaxe

• La logique propositionnelle est la logique la plus simple pour illustrer les idées de base

• Syntaxe = règle de grammaire

• Les symboles de proposition P1, P2 etc. sont des phrases– Si S est une phrase, S est une phrase (négation)– Si S1 et S2 sont des phrases, S1 S2 est une phrase (conjonction)– Si S1 et S2 sont des phrases, S1 S2 est une phrase (disjonction)– Si S1 et S2 sont des phrases, S1 S2 est une phrase (implication)– Si S1 et S2 sont des phrases, S1 S2 est une phrase (biconditionnel)

Logique propositionnelle: Sémantique

Chaque modèle spécifie la valeur vrai/faux pour un symbole de proposition

E.g. P1,2 P2,2 P3,1

false true false

Avec ces symboles, 8 modèles possibles peuvent être énumérés automatiquement

Règles pour évaluer la vérité par rapport à un modèle m:S is true iff S is false S1 S2 is true iff S1 is true and S2 is trueS1 S2 is true iff S1is true or S2 is trueS1 S2 is true iff S1 is false or S2 is true i.e., is false iff S1 is true and S2 is falseS1 S2 is true iff S1S2 is true and S2S1 is true

Processus récursif simple pour évaluer une phrase arbitrairement complexe, e.g.,P1,2 (P2,2 P3,1) = true (true false) = true true = true

Table de vérité pour les connecteurs logiques

Pour ce système avec 2 symboles de proposition:- 4 mondes possibles

Phrase dans le monde de Wumpus

Supposons que Pi,j est vrai si il y a une fosse à [i, j].

Et Bi,j est vrai si il y a une brise à [i, j]. P1,1

B1,1

B2,1

• "Pits cause breezes in adjacent squares” (une fosse cause la brise dans les carrés adjacents)B1,1 (P1,2 P2,1)

B2,1 (P1,1 P2,2 P3,1)

Table de vérité pour inférence

À vérifier

Vérifier pour chaque ligne où KB est vraie (modèle de KB) si la conclusion est aussi vraie.

Inférence par énumération• Profondeur d’abord pour énumérer tous les modèles• Procédure adéquate et complète

• C’est une approche sémantique• Pour n symboles, complexité en temps O(2n), en espace O(n)

Méthodes de preuve• Méthodes de preuve divisées grosso modo en 2 catégories:

– Model checking (Vérification de modèles)• Énumération en utilisant une table de vérité (toujours exponentiel en n)• Retour en arrière (backtracking) amélioré, e.g., Davis--Putnam-

Logemann-Loveland (DPLL)• Recherche heuristique dans l’espace de modèles (adéquate mais non

complet)e.g., algorithme hill-climbing qui favorise le conflit minimal

– Application de règles d’inférence• Génération légitime (sound) de phrases nouvelles à partir des

anciennes• Preuve = une séquence d’applications de règles d’inférence• Peut utiliser les règles d’inférence comme opérateur dans un algorithme

de recherche standard• Typiquement, ceci demande à transformer une phrase en une forme

normale (pour simplifier la procédure)

Par ordinateur?• L’ordinateur a beaucoup de problème pour manipuler la

sémantique– Il peut faire la vérification dans une table de vérité– Mais complexité exponentielle

• Une approche syntaxique– Manipulations des expressions pour tenter d’arriver à la

conclusion– Procédure d’inférence

• En maths?

Équivalences logiques• 2 phrases sont logiquement équivalentes ssi elles sont

vraies dans les mêmes modèles : α ≡ ß ssi α╞ β et β╞ α

Comment vérifier l’équivalence?

• Vérifier dans la table de vérité si 2 expressions ont toujours les mêmes valeurs de vérité

• A B et (A) B ?

• Utilité des équivalences– Une expression peut être transformée en une

autre équivalente

Validité et satisfiabilité d’une phrase

Une phrase est valide si elle est vrai dans tous les modèles,e.g., True, A A, A A, (A (A B)) B

La validité est reliée à l’inférence via le Théorème de déduction:KB ╞ α si et seulement si (KB α) est valide

Une phrase est satisfiable si elle est vraie dans quelques modèlese.g., A B, C

Une phrase est insatisfiable si elle est vraie dans aucun modèlee.g., AA

La satisfiabilité est reliée à l’inférence via la propriété suivante:KB ╞ α si et seulement si (KB α) est insatisfiable


– Model checking (Vérification de modèle)• Énumération en utilisant une table de vérité (toujours exponentiel en n)• Retour en arrière (backtracking) amélioré, e.g., Davis--Putnam-







Règles d’inférence

• Forme générale d’une règleab

– Signification: Si a est accepté, alors on accepte aussi b

– Une procédure de preuve• Ensemble de phrases KB0

• Pour une règle d’inférence, si a est dans KB0, alors on ajoute dans KB0: KB1

• Si dans un KBn, on voit la conclusion C, alors C est prouvée.

Règles: exemples

• Modus Ponens, a a b

b• Modus Tolens

, b a b a

• Et-élimination a b

a

Exemple de preuve• KB0 = {A, A B, C, BC D}

a = D

KB1 avec MP: {A, A B, C, BC D, B}

KB2 avec MP: {A, A B, C, BC D, B, D}

Prouvé #

• Recherche– KB0, KB1, KB2 comme états

– Une application de règle d’inférence = successeur

RésolutionConjunctive Normal Form (CNF) (forme normale conjonctive)

conjonction de disjonctions de littéraux = clauses

E.g., (A B) (B C D)

• Règle de résolution (pour CNF):li … lk, m1 … mn

li … li-1 li+1 … lk m1 … mj-1 mj+1 ... mn

où li et mj sont des littéraux complémentaires(i.e. li = mj)

E.g., P1,3 P2,2, P2,2

P1,3

• Règle de résolution est adéquate et complète pour la logique de proposition

Résolution

Une démonstration informelle de l’adéquation de la règle de résolution:

l1 … li-1 li li+1 … lk ≡ (li … li-1 li+1 … lk) lim1 … mj-1 mj mj+1 ... mn ≡ mj (m1 … mj-1 mj+1 ... mn)

(li … li-1 li+1 … lk) li mj (m1 … mj-1 mj+1 ... mn)

(li … li-1 li+1 … lk) (m1 … mj-1 mj+1 ... mn)

≡ li … li-1 li+1 … lk m1 … mj-1 mj+1 ... mn

Résolution

Une démonstration informelle de l’adéquation de la règle de résolution:

A B ≡ (A) B

B C ≡ B C

(A) B B C

(A) C

= A C

Conversion en CNF

B1,1 (P1,2 P2,1)

1. Éliminer , remplacer α β par (α β)(β α).(B1,1 (P1,2 P2,1)) ((P1,2 P2,1) B1,1)

2. Éliminer , remplacer α β par α β.(B1,1 P1,2 P2,1) ((P1,2 P2,1) B1,1)

3. Déplacer vers l’intérieur en utilisant les règles de Morgan et double-négation:

(B1,1 P1,2 P2,1) ((P1,2 P2,1) B1,1)

4. Appliquer la loi de distributivité ( sur ) et aplatir :(B1,1 P1,2 P2,1) (P1,2 B1,1) (P2,1 B1,1)

Algorithme de Résolution• Preuve par contradiction/réfutation, i.e., montrer que

KBα est insatisfiable (ou monter que ça mène à la contradiction ( )

Exemple

• KB = (B1,1 (P1,2 P2,1)) B1,1 α = P1,2

Chaînage avant et arrière• Forme Horn (plus restreinte)

KB = conjonction de Clauses Horn– Clause Horn =

• Symbole de proposition; ou• (conjonction de symboles) symbole

– E.g., C (B A) (C D B)

• Modus Ponens (Pour forme Horn): complet pour KB en forme Horn

α1, … ,αn, α1 … αn β

β

• Peut être utilisé avec chaînage avant (forward chaining) ou chaînage arrière (backward chaining).

• Ces algorithmes sont très naturels et demandent un temps linéair •

Chaînage avant• Idée: Activer une règle dont les prémisses sont

satisfaites dans KB,– Ajouter son conclusion dans KB, jusqu’à la requête soit trouvée

dans KB

Algorithme

• Chaînage avant est adéquat et complet pour KB en Horn

Exemple de chaînage avant

Preuve de complétude• Chaînage avant dérive toute phrase atomique

qui est entraînée par KB1. Il atteint un point fixe où aucune phrase atomique

nouvelle est dérivée2. Considérer cet état final comme un modèle m, qui

assigne true/false aux symboles3. Chaque clause dans la KB originale est vraie dans m

a1 … ak b

4. Donc, m est un modèle de KB5. Si KB╞ q, q est vraie dans chaque modèle de KB, y

compris m6. Donc, q peut être dérivée.

Chaînage arrièreIdée: travailler vers arrière à partir de la requête q:

Pour prouver q par chaînage arrière,Si q est déjà connue, ouProuver par chaînage arrière toutes les prémisses d’une règle

d’inférence qui conclut en q

Éviter des boucles : vérifier si un nouveau sous-but est déjà dans le stack de buts (- comparer avec la recherche dans un graphe)

Éviter la répétition : vérifier si le nouveau sous-but1. est déjà prouvé vrai, ou2. a déjà échoué dans sa preuve

Exemple de chaînage arrière

Chaînage avant vs. arrière

• Ch. avant est une procédure data-driven, automatique, inconsciente du problème à résoudre,– e.g., reconnaissances d’objet, décisions routine

• Peut faire beaucoup de travail non pertinent au but

• Ch. arrière est une procédure goal-driven, appropriée pour la résolution du problème,– e.g., où sont mes clés? Comment puis-je entrer dans un

programme de doctorat?

Complexité de Ch. arrière peut être beaucoup moins que linéaire à la taille de KB

•


– Model checking (Vérification de modèle)• Énumération en utilisant une table de vérité (toujours exponentiel en n)• Retour en arrière (backtracking) amélioré, e.g., Davis--Putnam-







Inférence propositionnelle efficace

2 familles d’approches efficaces pour l’inférence propositionnelle

• Algorithmes de recherche en arrière complète– Algorithme DPLL (Davis, Putnam, Logemann, Loveland)

• Algorithmes de recherche locale incomplète– Algorithme WalkSAT

Algorithme DPLLDéterminer si une phrase de logique propositionnelle en entrée (en

CNF) est satisfiable.

Améliorations sur l’énumération de la table de vérité:1. Terminaison hâtive

Une clause est vraie si chaque littéral est vrai.Une phrase est fausse si une de ses clauses est fausse.

2. Heuristique de symbole purSymbole pur: toujours apparaître avec le même « signe » dans toutes les

clauses. e.g., Dans les 3 clauses (A B), (B C), (C A), A et B sont purs, C n’est

pas pur. Faire un symbole pur vrai.

3. Heuristique de clause unitéClause unité: seulement un littéral dans la clauseLa seule littérale dans la clause doit être vraie.

Algorithme DPLL

Algorithme WalkSAT

• Algorithme incomplet, recherche locale• Fonction d’évaluation : heuristique de conflit min pour

minimiser le nombre de clauses insatisfaites

• Compromis entre voracité et le caractère aléatoire

Algorithme WalkSAT

Problèmes de satisfiabilité difficiles

• Considérer des phrases 3-CNF aléatoires. e.g.,

(D B C) (B A C) (C B E) (E D B) (B E C)

m = nb. de clauses

n = nb. de symbols

– Problème difficiles semblent apparaître autour de m/n = 4.3 (point critique)


• Temps médiane pour 100 phrases 3-CNF aléatoires satisfiables, n = 50

Agent basé sur inférence dans le monde de wumpus

Un agent du monde wumpus utilisant la logique propositionnelle :

- Exprimer les observations et les règles du jeuP1,1

W1,1

Bx,y (Px,y+1 Px,y-1 Px+1,y Px-1,y)

Sx,y (Wx,y+1 Wx,y-1 Wx+1,y Wx-1,y)

W1,1 W1,2 … W4,4

W1,1 W1,2

W1,1 W1,3 …

64 symboles de proposition distincts, 155 phrases

• KB contient des phrases "physiques" pour chaque carré

• Pour chaque moment t et chaque place [x,y],

Lx,y FacingRight t Forward t Lx+1,y

• Prolifération rapide de clauses• Intractable pour des applications réelles• Vers la logique de prédicats (logique de premier ordre)

Limitation de capacité d’expression de logique propositionnelle

tt

Sommaire• Les agents logiques appliquent des inférences sur une base de

connaissances pour dériver de nouvelles informations (conclusions) et prendre des décisions

• Concepts de base en logique:– syntaxe: structure formelle de phrases– sémantique: vérité de phrases par rapport aux modèles– entaînement: une phrase nécessairement vrai étant donné une autre– inférence: dériver des phrases à partir des autres phrases– Adéquation (soundness): des dérivations produisent seulement des phrases

impliquée (conséquences logiques)– complétude: des dérivations peuvent produire toutes les phrases impliquées

(conséquences logiques)• Le monde de Wumpus demande la capacité de représenter des

informations partielles et négatives, raisonner pour des cas, etc.• La règle de résolution (et la procédure d’inférence correspondante) est

complète pour la logique de propositions• Chaînage avant et arrière demandent un temps linéaire, sont complets pour

des clauses Horn• Logique propositionnelle manque d’expressivité

agents logiques chap. 7. plan agents basés sur des connaissances le monde de wumpus logique en...

Documents