1
République Algérienne Démocratique et PopulaireMinistère de l'Enseignement Supérieur et de la Recherche Scientifique
Université M'hamed Bougara - Boumerdès
Faculté des SciencesDépartement d’Informatique
MEMOIRE
Pour l’obtention du diplôme de MAGISTER
Spécialité : Systèmes informatiques et génie des logiciels.
Option : Spécification de Logiciel et Traitement de l’Information
Thème :
Présenté par : SEDDOUD FERROUDJA.
Devant le jury :
Mr. MEZGHICHE Mohamed Pr UMBB Président
Mr. DJOUADI Yassine Pr UMMTO Promoteur
Mme. AISSANI –MOKHTARI Aicha Pr USTHB Examinatrice
Mme. KHELLAF-HANED Faiza MCA USTHB Examinatrice
Année universitaire : 2011/2012.
Construction du treillis de concepts formels pour des contextes à
intervalle de vérité à partir d’implications résiduées
2
REMERCIEMENTS
Mes vifs remerciements accompagnés de toute ma gratitude vont à mon
encadreur Monsieur DJOUADI Yassine, maître de conférence à l’UMMTO, pour
m’avoir accueillie dans son équipe de recherche, pour ces remarques et conseils
judicieux qui mon beaucoup contribué à l’amélioration de ce mémoire et surtout, pour
sa rigueur scientifique et sa disponibilité. Je le remercie également pour m’avoir initiée
à la recherche et de m’avoir fait bénéficier de ces connaissances.
Je voudrais également remercier vivement Monsieur le président du jury
MEZGHICHE Mohamed, professeur et directeur de l’école doctorale d’informatique à
l’UMBB, pour nous avoir accueilli dans son laboratoire LIFAB et nous avoir fourni
une formation riche pendant notre première année de magister.
Je tiens à remercier vivement madame AISSANI MOKHTARI Aicha, professeur
à l’USTHB qui nous a fait l’honneur d’accepter de juger ce modeste travail et y avoir
consacré son précieux temps
De la même manière, je tiens à remercier vivement madame HANED Faïza,
maître de conférences à l’USTHB qui nous a fait l’honneur d’accepter de juger ce
modeste travail et y avoir consacré son précieux temps.
Je tiens à remercier madame AMIROUCHE Fatiha, maître de conférences à
l’UMMTO qui nous a fait l’honneur d’accepter de juger ce modeste travail et y avoir
consacré son précieux temps
Enfin, que tous ceux qui nous ont aidés et encouragés, de près ou de loin,
retrouvent notre gratitude et s’incères remerciements.
3
A ma très chère maman et mon très cher Papa.A Hamou et sa famille ainsi que mon très cher fils Mehdi.
A mes frères Belaïd, Hacene et mon petit frère Yacine.
4
Liste des tables
Table II.1 Représentation du contexte formel C ............................................................5
Table II.2 Contexte d’extraction de règles d’association D ............................................18
Table II.3 Les sous-ensemble d’items fermés fréquents du D ......................................20
Table II.4 Base de Duquenne Guigues du contexte D ..................................................22
Table II.5 Base propre de Luxenburger extraite du contexte formel D ..........................23
Table II.6 Relation binaire terme /Document .................................................................24
Table II.7 Table représentant la fonction F ....................................................................26
Table III.1 Les principales normes et co-normes triangulaires.......................................35
Table III.2 Table de vérité de l’implication classique ( → ) .........................................38
Table III.3 Les principales S-implication .......................................................................39
Table III.4 Les R-implications les plus courantes...........................................................41
Table IV.1 Contexte formel flou .....................................................................................44
Table IV.2 Relation binaire floue Régions/Climat ..........................................................49
Table IV.3 Table représentant le contexte formel flou D................................................59
Table IV.4 Table représentant le contexte formel non flou pour =0.8..........................60
Table IV.5 Table représentant le contexte formel du contexte D′ ..................................60
Table IV.6 Relation binaire floue termes/documents .....................................................63
Table V.1 Table de vérité de et ( ) ......................................................71
Table V.2 Contexte formel illustrant la relation R...........................................................77
Table V.3 Liste des concepts formels de l’implication de Gödel ....................................79
Table V.4 Liste des concepts formels flous de Dienes Nilpotent ...................................79
5
Liste des figures
Figure II.1 Hiérarchie (treillis) des concepts formels......................................................6
Figure II.2 Hiérarchie des concepts formels après le rajout des deux animaux.............8
Figure II.3 Treillis des sous-ensembles d’items fermés du contexte D ..........................19
Figure II.4 Treillis des sous-ensembles d’items fermés fréquents du contexte D ..........20
Figure II.5 Deux arbres de décision représentant la fonction F .....................................26
Figure III.1 Fonction caractéristique (ensemble classique)............................................30
Figure III.2 Fonction d’appartenance (ensemble flou) ...................................................30
Figure III.3 Vue horizontale d’ensemble flou -coupe ...................................................32
Figure III.4 Vue verticale d’une -coupe .......................................................................32
6
NotationDescription des symboles utilisés dans le mémoire
Join(E) : Le plus petit majorant des éléments de E.
Meet(E): Le plus grand minorant des éléments de E.
: Relation d’ordre.
: Relation de couverture.
A\B : Différence ensembliste.∪ : Union.: Union généralisée.∩ : Intersection.: Intersection généralisée.⊆ : Inclusion.⊂ : Inclusion sans égalité.
|E| : Cardinalité de l’ensemble E.
2E : Ensemble des parties de E.
: Implication.⇔ : Equivalence.
f g(.) : Composition de fonctions.
: Complémentation
7
SOMMAIRE
Chapitre I. Introduction générale
I. Introduction...................................................................................................................1
Chapitre II. L'analyse de concepts formels (classique)II.1. Introduction...............................................................................................................4II.2. Rappels Mathématiques ...........................................................................................8II.3. Connexion de Galois ..............................................................................................11II.4. Théorie de l'analyse de concepts formels...............................................................12II.5. Généralisation des opérateurs de dérivation ..........................................................14II.6. Application de l'analyse de concepts formels .........................................................15
II.6.1. La découverte des règles d'association...........................................................15II.6.1.1. Approche orienté fréquents ....................................................................17II.6.1.2. Approche basée sur l'ACF .....................................................................19
II.6.2. La recherche d'information ..............................................................................23II.6.3. La classification ...............................................................................................25
II.7. Conclusion..............................................................................................................27
Chapitre III. Théorie des ensembles flousIII.1. Introduction..............................................................................................................29III.2. Rappels sur la théorie des ensembles flous ............................................................ 29III.3. Les opérations ensemblistes floues......................................................................... 34
III.3.1. Intersection et union d’ensembles flous.......................................................... 34III.3.2. Le Complément .............................................................................................. 36III.3.3. Le produit cartésien ........................................................................................ 36III.3. 4. Les relations floues et la composition de relations ........................................ 37III.3.5. L’égalité .......................................................................................................... 38III.3.6. L'inclusion....................................................................................................... 38
III.4. Les implications floues........................................................................................... 38III.4.1. S-implication................................................................................................... 39III.4.2. R-implication................................................................................................... 40
III.5. Conclusion............................................................................................................. 43
Chapitre IV. Analyse de concepts formels floueIV.1. Introduction ........................................................................................................... 44IV.2. Contexte formel flou et concepts formels flous...................................................... 45IV.3. Etat de l'art ............................................................................................................ 46
IV.3.1. Rappels mathématiques ................................................................................ 47
8
IV.3.2. Approches existantes.................................................................................... 48IV.3.2.1. Approche de Burusco et al. ................................................................ 48IV.3.2.2. Approche de Pollandt et Belohlavek ................................................... 52IV.3.2.3. Approche de Georgescu et Popescu .................................................. 55IV.3.2.4. Approche dite "One sided fuzzy formal context " ................................ 56IV.3.2.5. Approche basée sur les -coupes ...................................................... 59
IV.4. Généralisation des opérateurs de dérivation de Galois au cas flou ...................... 61IV.5. Application de l’ACF floue en RI............................................................................ 62IV.6. Problématique ....................................................................................................... 64IV.7. Conclusion ............................................................................................................ 65
Chapitre V. ContributionV.1. Introduction ............................................................................................................ 66V.2. Proposition d’une algèbre minimale ....................................................................... 66V.3. Génération des concepts formels flous .................................................................. 72
V.3.1. Finitude ........................................................................................................... 72V.3.2. Présentation de l’algorithme............................................................................ 75
V.4. Conclusion ............................................................................................................. 79
Chapitre VI. Conclusion & Perspectives
VI.1. Conclusion ............................................................................................................ 80VI.2. Perspectives.......................................................................................................... 80Annexes......................................................................................................................... 82Bibliographie.................................................................................................................. 84
9
RESUME
Classiquement l’analyse de concepts formels est basée sur des relations binaires et
Booléennes entre un ensemble d’objets et un ensemble de propriétés (appelé contexte formel).
Généralement ces relations sont complètement renseignées. Il s’avère que dans la réalité
certaines relations entre objets et propriétés peuvent être partiellement connues, incertaines,
imprécises, vagues, floues ou carrément inconnues. De ce fait, l’ACF est amenée à considérer
des relations de diverses natures, modélisant des réalités concrètes (e.g. mesures,
observations, jugements,…etc.) Plusieurs approches proposent d’étendre l’ACF à l’ACF
floue. Actuellement, la tendance générale de l’ACF consiste à utiliser une algèbre résiduée
pour maintenir les propriétés de fermeture.
Notre première contribution consistera à trouver une algèbre minimale (plus
faible que la résiduation). Une telle algèbre délivre un ensemble d’implications floues
plus général (plus grand) que l’ensemble des implications résiduées.
L’ensemble des concepts formels flous (treillis de concepts formels) obtenu à
partir d’une implication residuée est généralement infini. Aussi, il n’existe pas
d’approche dans la littérature proposant la construction intégrale de ce treillis (car il
est infini). Notre deuxième contribution consistera à : Mettre en évidence quelques
implications floues qui engendrent un ensemble fini de concepts formels
Mots clés : Analyse de concepts formels, Contextes flous, treillis algébriques flous,
R-implication.
10
Abstract
Basically, formal concept analysis is concerned with binary Boolean relations
(called formal contexts) between a set of objects and a set of properties. Generally this
relation is completely defined. In the reality some relations are partially defined,
uncertain, imprecise, and fuzzy or bluntly unknown. Consequence So, FCA considered
various natures of relations that specify concretes reality (e.g. measures, observations,
judgments). Several proposals for extending formal concept analysis to fuzzy FCA.
Currently, a general tendency of FCA consists of using a residuation algebra for
minting the closure property and Galois connection property.
Our first contribution consists of finding a minimal algebra. This algebra release
a fuzzy implication set is more general that a residuated implications set.
A fuzzy formal concepts set (formal concepts lattice) obtain from a residuated
implication is generally infinite. In the literature it not exist proposals that proposed
the integral contraction of the lattice (because it is infinite). Our second contribution
consist of plainly visible some fuzzy implications that engender a finite set of formal
concepts
Keywords: Formal concept analysis, Fuzzy context, Fuzzy lattice, R-implication.
11
الملخصبین Booléenneعلاقة ثنائیة و علىمبني ″Analyse de concepts formels″كلاسیكیا، التحلیل لفكرة قطعیة َ
.contexte formel″″مجموعة مواضیع و مجموعة خواص، ھذه العلاقة تدعى بالنص الصریح
معرفة جزئیا، غیر أكیدة، غیر دقیقة، غامضة أو غیر معرفة : مـن المؤكـد أن ھناك علاقات بین المـواد و الخـواص تكونموجھة للأخـــذ بعیـن الاعتبار العـلاقــات المختلفـة التي ″ACF″فكــرة قطعیة مـن ھــذا المنطلق، التحلیل ل. بالكـامل
إلخ...قیاسـات، ملاحظات، أحكام (تجسد حقـائق ملموسـة
Analyse de ″إلى التحلیل الغامض لفكرة قطعیـة ″ACF″الكثیر من المذاھب تقترح توسیع التحلیل لفكرة قطعیة concepts formels floue une algèbre″حالیا ھناك نزعة عامة لاستعمال [1,0].نتـمي إلــى المجــال ت″
résiduée″للحفاظ على خواص الإغلاق
و التـي تحافظ على خواص الإغلاق و ″une algèbre non résiduée″بحثنــا یكمـن فـي إیجـاد و تعریف″Galois″خواص صلة
ر-التحلیل لفكرة قطعیة، النص الصریح،النص الغامض، الإنشاء التشاكلي الغامض، علاقة الإستلزام : المفاتیحكلمات
Chapitre I Introduction générale
1
Introductiona théorie de l’analyse de concepts formels (abrév. ACF) a été introduite par
Wille en 1982 [Wille 1982]. Cette théorie permet d’induire des structures
hiérarchiques de concepts formels à partir de structures (représentations)
relationnelles. Elle a été utilisée dans divers domaines: psychologie, sociologie,
médecine, biologie, linguistique, informatique, etc. [Wolff 1993].
L’analyse de concepts formels consiste à découvrir des clusters de connaissance
à partir de relations binaires. Généralement, ces relations sont représentées sous forme
de tables avec en ligne des objets et en colonne des propriétés. Etant donné une
relation R, l’intersection d’une ligne et d’une colonne (i.e. cellule) indique si un objet"x" vérifie ou ne vérifie pas la propriété "a". Classiquement, les relations considérées
sont non seulement binaires et booléennes mais aussi complètement renseignées (c.à.d.
il est toujours connu si un objet possède ou ne possède pas une propriété).
Il s’avère que dans la réalité, certaines relations entre objets et propriétés peuvent
être partiellement connues, incertaines, imprécises, vagues, floues ou carrément
inconnues. De ce fait, l’ACF est amenée à considérer des relations de diverses natures,
modélisant des réalités concrètes (e.g. mesures, observations, jugements, etc.) où
peuvent apparaître des questions de gradualité et/ou d’incertitude. A titre d’exemple,
dans le domaine de l’enseignement il est parfois difficile d’évaluer le niveau de
maitrise de la langue Anglaise pour un élève donné. L’enseignant peut estimer un tel
niveau par une valeur numérique comprise entre 0 et 1 et donc, il peut dire qu’un tel
élève maitrise l’Anglais à 80%.
La présence de ces valeurs imprécises et floues, a suscité de nombreuses
recherches dans le cadre de l’analyse de concepts formels floue notamment en ce qui
concerne la généralisation des opérateurs de fermeture concernant des relations floues
et le problème sous-jacent de la génération des concepts formels flous.
Toutes les approches existantes [Pollandt 1997], [Belohlavek 1998], [Latiri
2003], [Georgesco 2004], [Ben Yahia 2007], [Medina 2009] utilisent une implication
L
Chapitre I Introduction générale
2
résiduée c.à.d. telle que ( ≤ ⇔ ∗ ≤ ). Le fait d’utiliser une implication
résiduée restreint considérablement le nombre d’implications éligibles pour l’ACF
floue.
Notre première contribution consistera alors à prouver une algèbre minimale
(plus faible que la résiduation). Une telle algèbre délivre un ensemble d’implications
floues plus général (plus grand) que l’ensemble des implications résiduées.
L’ensemble des concepts formels flous (treillis de concepts formels) obtenu à
partir d’une implication residuée est généralement infini. Aussi, il n’existe pas
d’approche dans la littérature proposant la construction intégrale de ce treillis (car il
est infini).
Notre deuxième contribution consistera à Mettre en évidence quelques
implications floues qui engendrent un ensemble fini de concepts formels et Proposer
les algorithmes permettant de déterminer de manière effective et efficace l’ensemble
des concepts formels.
Pour ce faire ce mémoire s’articule autour de cinq chapitres :
Le premier chapitre : concerne une introduction générale.
Le second chapitre : porte sur l’analyse de concepts formels (cas classique). Dans
ce chapitre nous commençons par une représentation intuitive de [Wille 1982], nous
donnons par la suite une représentation basée sur des fondements mathématiques ainsi
que des notions de fermeture de connexion de Galois. Comme nous avons abordé à la
fin de cette section quelques applications de l’analyse de concepts formels
Le troisième chapitre : présente en détail la théorie des ensembles flous ainsi que
les différents opérateurs algébriques et essentiellement les implications floues
(notamment les R-implications).
Le quatrième chapitre : porte sur l’analyse de concepts formels floue. Dans cette
partie nous donnons les notions de base d’une ACF floue et par la suite, nous
présentons les différentes approches qui existent. Nous terminons cette partie par les
applications de l’ACF floue, en se limitant au domaine de la recherche d’information.
Chapitre I Introduction générale
3
Le dernier chapitre: est réservé à notre contribution. Dans ce chapitre nous
présentons deux contributions. La première contribution portera sur un aspect
méthodologique, elle consistera à prouver une algèbre minimale ainsi nous renforçons
les fondements théoriques de l’ACF floue en élargissant les algèbres actuellement
utilisées. La deuxième contribution portera sur un aspect opérationnel et constructif
qui exhibe deux implications : la première est l’implication de Gödel et la deuxième
est l’implication de Dienes Nilpotent. Nous terminons par la présentation des
algorithmes de ces implications.
Enfin nous concluons et présentons des perspectives futures à ce travail.
Chapitre II Analyse de concepts formels
4
II.1. IntroductionL’analyse de concepts formels a été introduite par Wille en 1982 [Wille 1982].
L’ACF permet d’induire des clusters de connaissances et se présente comme une
méthode d’apprentissage et de représentation de connaissances. Elle a été utilisée dans
divers domaines : psychologie, sociologie, biologie, médecine, linguistique,
mathématiques, informatique, etc.
Nous commençons notre étude par une présentation intuitive de l’ACF sans pour
autant introduire de formalisme mathématique. Nous consacrerons par la suite une
section complète pour la présentation théorique de l’ACF sur la base de fondements
mathématiques (algébriques).
Pour bien fixer les idées nous devons connaitre c’est quoi un concept formel ?
D’un point de vue psychologique, un concept formel est une unité de pensée constituée
de deux parties, la partie "extension" et la partie "intension". La partie
extension recouvre tous les objets du concept formel et la partie intension comprend
toutes les propriétés possédées par tous ces objets. En effet les objets et les propriétés
jouent un rôle proéminent ensemble avec les différentes relations comme: la hiérarchie
entre les concepts (sur-concept, sous-concept) la relation d’implication entres
propriétés et la relation d’incidence entre les paires (objet/ propriété) (un objet possède
une propriété).
L’idée de Wille était d’illustrer dans un premier temps les paires (objet/
propriété) ainsi que la relation d’incidence selon une représentation mathématique
appelé contexte formel, ce dernier est considéré comme un outil de description des
situations élémentaires sous la forme: l’objet "x" possède la propriété "a". Dans un
deuxième temps, il s’agira de découvrir les ensembles maximaux des objets
satisfaisant un certain ensemble de propriétés.
Chapitre II Analyse de concepts formels
5
ExempleSoit un ensemble d’animaux {lion, rouge-gorge, aigle, lièvre, autruche} décrit
par rapport à certaines de leurs propriétés {prédateur, vole, ovipare, mammifère}. Le
contexte formel noté C (autrement dit la relation binaire) est représenté sous forme
d’une table avec en lignes les animaux (correspondant aux objets) et en colonnes les
propriétés, telle que si l’objet "xi" vérifie (resp. ne vérifie pas) la propriété "aj" alors la
cellule "cij" est marquée par une croix (resp. reste vide).
Attribut
Animal
prédateur vole ovipare mammifère
lion × ×rouge-gorge × ×aigle × × ×autruche ×lièvre ×
Table II.1: Représentation du contexte formel C
Pour expliquer la notion de concept formel, nous considérons toutes les
propriétés du rouge-gorge {vole, ovipare} et posons-nous la question: quels sont les
animaux satisfaisant ces propriétés? Nous obtenons alors l’ensemble X = {aigle, rouge-
gorge}. Nous constatons que l’ensemble X est l’ensemble maximal des animaux
satisfaisant toutes les propriétés de l’ensemble A = {vole, ovipare}.
Il résulte que X est l’ensemble de tous les animaux vérifiant toutes les propriétés
de A et A est l’ensemble de toutes les propriétés vérifiées par tous les animaux de X. La
paire ⟨ , ⟩est appelé concept formel. Tandis que X est appelé extension et A est
appelé intension.
Hiérarchie entre concepts formels
Entre les concepts formels, il y a une relation d’ordre partiel c.à.d. la relation"Sous-concept, Sur-concept".
Chapitre II Analyse de concepts formels
6
Etant donné deux concepts formels ⟨ , ⟩, et ⟨ , ⟩. On dit que ⟨ , ⟩ est un
sous-concept de ⟨ , ⟩, (dualement ⟨ , ⟩ est un sur-concept de ⟨ , ⟩) si l’extension
de ⟨ , ⟩ est un sous ensemble de l’extension de ⟨ , ⟩. c.à.d. ⊆ (dualement:
l’intension de ⟨ , ⟩ est un sur-ensemble de l’intension de ⟨ , ⟩. c.à.d. A ⊇ ).
Reprenons l’exemple précédent. Etant donné les deux concepts formels suivants:⟨{aigle}, {prédateur, vole, ovipare}⟩ et ⟨{aigle, rouge-gorge}, {vole, ovipare}⟩.⟨{aigle}, {prédateur, vole, ovipare}⟩ est un sous-concept de ⟨{aigle, rouge-gorge},
{vole, ovipare}⟩ . Dualement, ⟨{aigle, rouge-gorge}, {vole, ovipare}⟩ est un sur-
concept de ⟨{aigle}, {prédateur, vole, ovipare} ⟩. L’extension {Aigle} du sous-concept
est un sous-ensemble de l’extension {aigle, rouge-gorge} du sur-concept. De la même
manière l’intension {prédateur, vole, ovipare} du sous-concept est un sur-ensemble de
l’intension {vole, ovipare} du sur-concept. Dans la Figure II.1, nous représentons la
hiérarchie de tous les concepts formels du contexte représenté dans la Table II.1. Il est
à noter que le type de représentation utilisé dans la Figure II.1 est une représentation
condensée. La règle suivante permet de lire tous les concepts formels.
Figure II.1 : Hiérarchie (treillis) des concepts formels
ovipareautruche
mammifèrelièvre prédateur
volerouge-gorge
aiglelion
Chapitre II Analyse de concepts formels
7
Comment lire la Figure II.1
Cette Figure est constituée de nœuds et de segments. Elle comporte aussi les
noms de tous les objets et toutes les propriétés du contexte. Chaque nœud correspond à
un concept formel. La Figure peut être lue comme suit: A chaque fois qu’un nœud "n"
est étiqueté par une propriété "a", tous les objets descendants de ce nœud "n" héritent
la propriété "a". De façons duale, à chaque fois qu’un nœud "n" est étiqueté par un
objet "x", "x" est hérité vers le haut et tous les ancêtres de nœud "n" le partage. Ainsi
l’extension "X" d’un concept ⟨ , ⟩ correspondant au nœud "n" est obtenue en
considérant tous les objets qui apparaissent sur les descendants du nœud "n" dans le
treillis et son intension est obtenue en considérant toutes les propriétés qui
apparaissent sur les ancêtres du nœud "n" dans le treillis.
Nous pouvons remarquer que dans cet exemple, l’intension du concept formel
sommet correspond à l’ensemble vide, tandis que l’extension de concept formel
sommet correspond à l’ensemble de tous les animaux. Nous pouvons trouver toute fois
un concept formel sommet différent de l’ensemble vide.
Relation d’implication entre les propriétés
L’interprétation de la Figure II.1 nous renseigne aussi sur diverses relations
d’implication entre propriétés. On dit que a→b, si " " un descendant de la
propriété " " or vole est descendant de ovipare alors vole → ovipare. Considérons les
implications entre propriétés déduites du contexte C suivantes:
1-vole → ovipare,
2-mammifère et vole → prédateur et ovipare,
Considérons l’univers des objets U. Nous constatons rapidement que les deux
implications (1 et 2) sont vérifiées dans C, mais elles ne sont pas vérifiées dans U.
nous citons deux contres exemples respectivement :
Une abeille vole mais elle n’est pas ovipare, une chauve-souris est mammifère et elle
vole mais elle n’est ni prédateur, ni ovipare. Alors la Figure II.1 devient :
Chapitre II Analyse de concepts formels
8
Figure II.2 : Hiérarchie de concepts formels après rajout
des animaux abeille et chauve-souris
II.2. Rappels MathématiquesDans cette section, nous rappelons quelques définitions nécessaires à notre
travail. Ces définitions concernent les ensembles ordonnés, les treillis, les treillis
complets et les opérateurs de fermeture. Ces définitions sont extraites de [Pasquier
2000].
Définition 1(Ensemble ordonné)
Soit E un ensemble, un ordre ou un ordre partiel sur l’ensemble E est une relation
binaire ≤, sur les éléments de E tel que pour tout a, b, c E nous avons les propriétés
suivantes :
1. Réflexivité : a ≤ a,
mammifèrelièvre
ovipareautruche
voleprédateur
rouge-gorge
aiglelionchauve-souris
abeille
Chapitre II Analyse de concepts formels
9
2. Antisymétrie : a ≤ b et b ≤ a a = b,
3. Transitivité : a ≤ b et b ≤ c a ≤ c.
Un ensemble E doté d’une relation binaire d’ordre≤, noté (E,≤ ), est appelé
ensemble ordonné.
Définition 2 (Ouvert)
Un ouvert est un sous ensemble d’un espace topologique qui ne contient aucun
point de sa frontière.
Exemple
Considérons l’ensemble des nombres réels R, l’intervalle ]0, 1[ est un ouvert. En
revanche, l’intervalle ]0, 1] n’est pas un ouvert, car l’élément "1" appartient à
l’intervalle ]0, 1].
Définition 3 (Topologie)
Une topologie dans U est une famille de sous-ensembles de U fermée par
rapport à une union arbitraire et une intersection finie et contenant l’ensemble ∅ et U.
Le couple ( , ) est nommé "espace topologique", les éléments de U appelés "les
points ", les éléments de appelés "ensembles ouverts ", Le complémentaire d’un
ensemble ouvert est un "ensemble fermé". Etant donné X ⊆ U l’intérieur I(X) de X est
le plus grand ensemble ouvert contenu dans X.
La famille B⊆ est la base de topologie si chaque ensemble ouvert est un sous
ensemble de B. il est bien clair que la famille des ensembles B est la base de certaines
topologies de U si et seulement si U = B et pour chaque X, Y ⊂ B. Etant donné
x ∈ (X∩Y), il existe Z ⊂ B tel que x ∈ Z⊆ (X∩Y).
Chapitre II Analyse de concepts formels
10
Définition 4 (Operateurs de fermeture)
Soit un ensemble partiellement ordonné (E, ≤). Une application de (E, ≤)dans
(E, ≤) est un opérateur de fermeture si et seulement si elle possède les trois propriétés
suivantes pour tout élément a, b ∈ E :
1. Isotonie : a ≤ b (a) ≤ (b)
2. Extensivité: a ≤ (b)
3. Idempotence : ( (a)) = (a).
Etant donné un opérateur de fermeture sur un ensemble partiellement ordonné
(E, ≤), un élément ∈ est un élement fermé si l’image de par l’opérateur de
fermeture est égale à : ( ) = .Définition 5 (Relation de couverture)
Soit (E, ≤) un ensemble ordonné et , b, deux éléments de E. la relation de
couverture entre les éléments de E, notée , est définie par: si et seulement si≤ et il n’existe pas un élément E tel que ≤ ≤ avec ≠ et ≠ .
signifie que: couvre ou bien que est un successeur immédiat de .
Définition 6 (Opérateurs Join et Meet)
Soit un sous ensemble A E de l’ensemble ordonné (E, ≤). Un élément u E
est un majorant, ou upper- bound, de A si pour tout élément A nous avons ≤ u.
L’ensemble des majorants de A est noté UB(A). Dualement, un élément vE est un
minorant, ou lower-bound, de A si pour tout élément A nous avons v ≤ .
L’ensemble des minorants de A est noté LB(A).
UB(A) = {u A | A , ≤ u}
LB(A) = {v A | A , v ≤ }
Chapitre II Analyse de concepts formels
11
Le plus petit majorant d’un ensemble A, s’il existe, est le plus petit élément de
l’ensemble UB(A) des majorants de A. Cet élément est noté Join(A). dualement, le plus
grand des minorants d’un ensemble A, s’il existe, est le plus grand élément de
l’ensemble LB(A) des minorants de A. cet élément est noté Meet (A).
Join(A) = Min ∈ (UB(A)) = ∈ UB(A)
Meet(A) = Max ∈ (LB(A)) = UB∈ (A)
Définition 7 (Treillis complet)
Un ensemble ordonné (E, ≤) non vide est un treillis si pour tout couple d’élément
( , ) E l’ensemble {x, a} possède un plus petit majorant noté Join ({x, a}) et un plus
grand minorant noté Meet({x, a}). L’ensemble ordonné (E, ≤) est un treillis complet si
pour tout sous ensemble S ⊆ E les éléments Join(S) et Meet(S) existent. Les treillis
sont fréquemment représentés sous forme de diagrammes de Hasse, également appelé
graphes de couverture, dont les sommets sont les éléments de l’ensemble et les arcs
correspondent aux relations de couverture entre les sommets.
II.3. Connexion de Galois
Soit une relation binaire (notée R) complètement définie entre un ensemble
d’objet O et un ensemble de propriétés P . Soit l’application de l’ensemble des
parties de O dans l’ensemble des parties de P ( : 2O→2P) et soit l’application ψ de
l’ensemble des parties de P dans l’ensemble des parties de O ( : 2P →2O). Nous
donnons ci après la définition d’une connexion de Galois.
Définition 8 (Connexion de Galois)
La paire d’opérateur ( , ) est une connexion de Galois si la propriété suivante
est vérifiée ∀ ⊆ O, ⊆ P :⊆ ( ) et ⊆ ( )
Chapitre II Analyse de concepts formels
12
Un cas particulier de connexion de Galois est obtenu en définissant les fonctionset de la manière suivante. La fonction associe à un ensemble d’objets ⊆ O
l’ensemble ( ) des propriétés ∈ P communes à tous les objets x ∈ .(X) = { ∈ P | ∀ ∈ : R }.
La fonction associe à tout ensemble ⊆ P l’ensemble ( ) des objets x ∈ O
contenant toutes les propriétés ∈ .
( ) ={ ∈O / ∀ ∈ : R }.
Il est aisé de remarquer que le couple d’application ( , ) est une connexion de Galois
entre l’ensemble des parties de O et l’ensemble des parties de P. Les propriétés
suivantes sont vérifiées quelque soient les ensembles : , , ⊆P et X, Y, Z ⊆ O.
1. ⊆ ( ) ⊇ ( ) 1`. ⊆ (X) ⊇ (Y)
2. X ⊆ ( ) ⇔ ⊆ ( )II.4. Théorie de l’analyse de concepts formels
L’ACF fournit un cadre théorique pour l’apprentissage de la hiérarchie de
concepts formels. Cet apprentissage s’effectue à partir d’un contexte formel K = (O,
P, R) où R est une relation binaire complètement définie entre un ensemble d’objets
O et un ensemble de propriétés P. Généralement la relation R est représentée sous
forme d’une table avec en lignes des objets et en colonnes des propriétés telle que : la
présence d’une croix (×) (resp. l’absence) dans la cellule cij indique que l’objet x
satisfait (resp. ne satisfait pas) la propriété . Soulignons qu’une croix peut être aussi
représentée par la valeur 1. Soulignons aussi que dans la suite de ce mémoire nous
utiliserons indifféremment les termes propriétés et attributs pour désigner les éléments
de l’ensemble P.
Chapitre II Analyse de concepts formels
13
Etant donné un objet x et une propriété , soit R (x) ={ ∈P | xR }
l’ensemble des propriétés satisfaites par l’objet x (xR signifie que x possède la
propriété ) et soit R ( ) ={x ∈O | xR } l’ensemble
des objets possédant la propriété . On définit en ACF des correspondances entre les
ensembles 2O et 2P. Ces correspondances sont appelés opérateurs de dérivation de
Galois. Dans son papier précurseur sur l’analyse de concepts formels, Wille propose
l’utilisation d’un opérateur de dérivation de Galois de manière duale. Cet opérateur est
différemment noté dans la littérature par : (. )∗, (. )↑, (. )↓. Dans notre mémoire, nous
appellerons l’opérateur classique de Wille: opérateur de suffisance et nous le noterons(. )∆. Nous donnons ci-après sa définition.
Etant donné X ⊆O et ⊆P, l’opérateur de suffisance (noté(. )∆) permet :
- d’exprimer l’ensemble des propriétés satisfaites par tous les objets de X comme :∆ = { ∈ P |∀ x ∈O (x ∈ X→xR )}
={ ∈ P | XR ( )}
= ∈ R ( x)
- d’exprimer dualement l’ensemble des objets satisfaisant toutes les propriétés de
comme : ∆ = {x ∈O | ∀ ∈P (a ∈ →xR )}
={x ∈O | R ( x)}
= ∈ R ( )
La paire duale d’opérateurs ⟨(. )∆, (. )∆⟩ constitue ainsi une connexion de Galois qui
permet d’induire des concepts formels. Un concept formel est une paire ⟨ , ⟩ telle
que ∆ = et ∆ = X. Autrement dit, X est l’ensemble maximal d’objets satisfaisant
toutes les propriétés déjà satisfaites par tous les objets de X. Rappelons que l’ensemble
X (resp. ) est appelé extension (resp. intension) du concept.
Chapitre II Analyse de concepts formels
14
Soit B l’ensemble des concepts formels d’un contexte K= (O, P, R). Cet
ensemble est muni d’une relation d’ordre partiel définie comme suit :⟨ , ⟩ ⟨ , ⟩ ssi X Y (ou ).
Nous appelons alors ⟨ , ⟩ un sous-concept de ⟨ , ⟩ et ⟨ , ⟩ est un sur-concept de⟨ , ⟩. Dans Ganter et Wille, il a été démontré que l’ensemble B des concepts formels
muni de la relation d’ordre définie ci-dessus forme un treillis complet noté B(K).
Le Théorème Fondamental de Ganter et Wille [Ganter 1999] donne le Meet et le Join
pour chaque sous ensemble de concepts formels comme suit :
⟨ , ⟩∈ = ∈ , ∈∆ ∆
⟨ , ⟩∈ = ∈∆ ∆ , ∈
II.5. Généralisation des opérateurs de dérivationD’autres opérateurs de dérivation de Galois ont été mis en évidence dans le cadre
de l’analyse qualitative de données [Düntsch 2003]. Dans [Dubois 2009] Dubois et Prade
ont mis en évidence, dans le cadre de la théorie des possibilités de [Zadeh 1978], trois
nouveaux opérateurs de dérivation, à savoir l’opérateur de possibilité (noté (. ) ) ,
l’opérateur de nécessité (noté (. ) ) ainsi que l’opérateur (. )∇ dual de l’opérateur de
suffisance (. )∆ vu précédemment. Ces opérateurs sont définis sur les ensembles 2O et
2P comme suit :
Définition 9 (Opérateur de possibilité )
est l’ensemble de propriétés satisfaites par au moins un objet dans X
Chapitre II Analyse de concepts formels
15
= { ∈ P |X∩R ( ) ≠ ∅}
= { ∈ P |∃ ∈O, xR }
Définition 10 (Opérateur de nécessité N)
est l’ensemble des propriétés que seuls les objets de X ont
= { ∈ P |R( )⊆ }
= { ∈ P |∀ ∈O (xR ) → ∈ }
Définition 11 (Opérateur de suffisance dual )∇ est l’ensemble des propriétés non satisfaites par aucun objet de∇= { ∈P |X ∪R ( ) ≠X}
= { ∈P |∃ ∈ , x }
Les opérateurs , et ∇sont définis de manière duale. Il est à noter que les paires⟨ , ⟩ telles que = et =X caractérisent des sous-contextes formels indépendants
(i.e : qui n’ont en commun ni objets ni propriétés) à l’intérieur du contexte formel
initial [Djouadi 2010].
II.6. Application de l’Analyse de concepts formelsL’analyse de concepts formels donne lieu actuellement à diverses applications
notamment dans l’aide à la décision, la découverte de connaissances, la recherche
d’informations [Latiri. 2003], etc.
II.6.1. Découverte des règles d’association
L’extraction des règles d’association a pour but d’identifier des associations
significatives entre les données. Les relations ainsi identifiées peuvent être utiles pour
de nombreux organismes commerciaux, scientifiques, industriels et de gestion de
Chapitre II Analyse de concepts formels
16
l’information, afin d’améliorer leurs objectifs dans leurs activités. Par exemple, il est
important pour toute entreprise commerciale de recueillir des informations variées sur
le comportement de ses clients (préférences, habitudes) afin de mener diverses
analyses et d’en déduire des modalités d’actions. A ce titre, l’analyse des factures
(tickets de caisse) d’un supermarché permettra d’étudier les habitudes des clients
(citons par exemple : les clients qui achètent du lait ont tendance à acheter aussi du
café et du sucre.), en fonction de quoi il sera possible de réorganiser les rayons du
magasin afin d’améliorer les ventes.
L’exemple le plus populaire est celui du ‘panier de la ménagère’ qui consiste à
enregistrer l’ensemble des articles présents dans le panier d’un consommateur. Dans
cet exemple, chaque client est un objet et les articles achetés sont ses attributs, c’est
pour quoi on parle très souvent d’item pour désigner un attribut. Pour cela nous
utiliserons dans la suite de cette sous-section indifféremment les termes items et
attributs pour désigner les propriétés. Les premiers algorithmes ont fonctionné sur de
tels exemples afin de découvrir les associations cachées entre les articles achetés
ensemble. En extrayant des regroupements des articles achetés par une même
personne, nous pouvons prendre plusieurs décisions.
Généralement ; une règle d’association entre un sous-ensemble d’items
(attributs) et un sous-ensemble d’items (attributs) est notée : . Un processus
de découverte des règles d’association consiste à extraire toutes les règles
d’association telles que : support( )≥min-suport et confiance (A ) ≥ min-
confiance où support et confiance sont définis comme suit :
Support( ) =| ∆|| |
support ( ) =|( ∪ ) ∆|| | =
| ∆∩ ∆|| |confiance( ) =
( )( )
Chapitre II Analyse de concepts formels
17
min-support et min-confiance sont des paramètres fixés à priori. D’autre part, un sous-
ensemble d’items est dit fréquent si support ( ) ≥min-support. A ce titre, la
première approche proposée [Agrawal 1994] pour la découverte des règles
d’association a consisté à découvrir les ensembles d’items fréquents. Cette approche
dite orientée fréquents est présentée dans la sous section suivante tandis qu’une autre
approche basée sur l’ACF sera présentée dans la sous section consécutive.
II.6.1.1. Approche orientée fréquents
Cette approche consiste à effectuer de multiples balayages du contexte (c.à.d.
parcourir le contexte formel intégralement). Ces balayages sont nécessaires afin
d’évaluer les supports des ensembles d’items qui permettront de déterminer lesquels
sont fréquents et de définir la confiance des règles d’association. De ce fait, cette phase
est considérée comme la plus coûteuse en temps d’exécution d’un processus
d’extraction de règles d’association.
La génération des règles d’association est réalisée à partir de l’ensemble des
sous-ensembles d’items fréquents. Une règle d’association B est dite valide si sa
confiance est supérieure ou égale au seuil minimal de confiance min-confiance
[Pasquier 2000].
Les approches d’extraction de règles d’association basées sur les fréquents sont
confrontées à deux problèmes majeurs. Le problème de déterminer les sous-ensembles
d’items fréquents c.à.d. les sous-ensembles d’items dont le support est supérieur ou
égal à min-support. Ce problème a une complexité exponentielle. Il est donc nécessaire
de développer des méthodes efficaces d’exploration de cet espace de recherche
[Gunopulos 1997] [Mannila 1997] [Zaki 1998]. Un autre problème lié au problème
précédent réside dans la taille des sous-ensembles des items fréquents car pour un
ensemble d’items P, le nombre de règles d’association non triviales qui peuvent être
générées pour un item fréquent est important. Soulignons toutefois que le temps de
calcul pour la génération des règles d’association à partir des sous-ensembles d’items
fréquents est faible par rapport au temps nécessaire à la découverte des sous-ensembles
Chapitre II Analyse de concepts formels
18
d’items fréquents. Le problème de la réduction du temps de réponse de l’extraction des
règles d’association se réduit donc au problème de l’optimisation de la découverte des
sous-ensembles d’items fréquents. Un algorithme relativement efficace de génération
des règles d’association a été proposé par Agrawal et al dans [Agrawal 1994]. Cet
algorithme donne des temps de réponse acceptables dans la majorité des cas.
Le nombre de règles d’association générées varie en général de plusieurs dizaines
de milliers à plusieurs millions pour des grandes bases de données. Ce nombre
important de règles d’association extraits constitues un problème majeur pour la
pertinence et l’utilité du résultat. Ce problème est accentué par la présence de
nombreuses règles redondantes (définies ci-après) du point de vue de l’information
convoyée.
Règles d’association redondantes
Soit AR l’ensemble de règles d’association, une règle d’association r est dite
redondante si la règle r ainsi que sa confiance peuvent être déduits de l’ensemble AR\r.
Exemple
Soit le contexte formel D illustré dans la Table II.2. Considérons les seuils suivants :
min-support =2/6 et min-confiance = 1/2.
Table II.2: Contexte d’extraction de règles d’association D
Objet Items
1
2
3
4
5
6
a c d
b c e
a b c e
b e
a b c e
b c e
Chapitre II Analyse de concepts formels
19
Si nous considérons les règles suivantes : a bce, a be, a ce, a b, a e. Nous
pouvons remarquer que ces règles possèdent la même partie gauche (a), le même
support (2/6) et la même confiance (2/3). Nous remarquons clairement que les quatre
dernières règles sont redondantes vis-à-vis de la première règle a→bce.
A cette fin, la recherche des ensembles d’items fermés au sens de l’analyse de
concepts formels apporte une amélioration concrète au problème de découverte de
règles d’association. Nous présentons ci après cette méthode.
II.6.1.2. Approche basée sur l’ACF
Dans [Pasquier 2000], l’auteur propose une approche originale pour l’extraction
de règles d’association. Cette approche basée sur l’analyse de concepts formels et les
opérateurs de dérivation de Galois permet d’une part de réduire de manière indéniable
la complexité du processus, et d’autre part de générer seulement les règles
d’association non redondantes. Plusieurs autres auteurs ([Zaki 1998], [Ben yahia
2007]), confirment d’ailleurs l’intérêt d’utiliser la connexion de Galois et la notion de
fermés. Rappelons qu’un sous ensemble ⊆ P est dit fermé si ∆∆= . Il est dit fermé
fréquent si il est fermé et si support ( ) ≥ min-support.
Exemple: Le treillis des ensembles d’items fermés associé au contexte D est
représenté dans la Figure II.3
Figure II.3 : Treillis des sous-ensembles d’items fermés associé au contexte D
{abcde}
{acd} {abce}
{ac} {bce}
{c} {be}
∅
Chapitre II Analyse de concepts formels
20
L’ensemble des sous-ensembles d’items fermés fréquents dans le contexte D pour un
seuil minimal de support de 2/6 est représenté dans la Table II.3. L’itemset {bce} est
un itemset fermé fréquent pour min-support = 2/6 car support ({bce}) =(|{2, 3, 5, 6}| )/|O| =4/6, 4/6 ≥ min-support
Ensemble d’items fermés fréquents Support
{c}
{be}
{ac}
{bce}
{abce}
3/6
5/6
5/6
4/6
2/6
Table II.3 : Les sous-ensembles d’items fermés fréquents extraits
du contexte D pour min-support = 2/6
Le treillis des ensembles d’items fermés fréquents associé au contexte D est représenté
dans Figure suivante :
Figure II.4 : Treillis des sous-ensembles d’items fermés fréquents associé au contexte
D
Dans la suite nous distinguons deux types de règles d’associations : les règles
d’association exactes et les règles d’association approximatives.
{abce}
{ac} {bce}
{c} {be}
∅
Chapitre II Analyse de concepts formels
21
La base de Duquenne Guigues pour des règles d’association exactes
La base de Duquenne Guigues est définie en utilisant les sous-ensembles pseudo
fermés d’attributs du contexte selon la fermeture de connexion de Galois. Nous
définissons d’abord c’est quoi une règle d’association exacte et un sous-ensemble
d’attributs pseudo fermé.
Définition 12 (Règle d’association exacte)
Une règle d’association exacte est de la forme ( \ ) tel que sa confiance
est égale à 1 et , sont deux sous-ensembles d’items fréquents tels que ⊂ et
support ( )= support ( ).
Définition 13 (Ensemble d’items pseudo-fermés fréquents)
Soit F l’ensemble des sous-ensembles d’items fréquents. Un sous-ensemble
d’item ∈ est un pseudo fermé fréquent si il n’est pas fermé (( )∆∆ ≠ ) et si il
contient les fermetures de tous ses sous-ensemble qui sont des sous-ensembles d’items
pseudo fermés fréquents. L’ensemble PF des sous-ensembles d’items pseudo fermés
est défini par :
PF= { ∈ tel que : ( )∆∆ ≠ et ∀ ⊂ , ∈ PF nous avons ( )∆∆ ⊂ }
Définition 14 (Base de Duquenne Guigues)
Soit l’ensemble PF des sous-ensembles d’items pseudo fermés fréquents d’un
contexte formel. La base de Duquenne Guigues pour les règles d’association exactes
est
BDG={r : ( )∆∆\ tel que ∈ et ≠ }
Exemple
Les sous-ensembles d’items fréquents extraits du contexte formel D est :
{ , , , , , , , , , , , , , , }, l’ensemble des sous-
ensemble d’items pseudo fermés fréquents est présenté dans la Table II.3
Chapitre II Analyse de concepts formels
22
Sous-ensemble pseudo fermé fréquent Fermeture Règle exacte Support
{ }
{ }
{ }
{ }
{be}
{ }
3/6
5/6
5/6
Table II.4 : Base de Duquenne Guigues extraite du contexte formel D
pour un min-support=2/6
La base de Luxenburger pour les règles d’association approximatives
Nous définissons d’abord c’est quoi une règle d’association approximative
Définition 15 (Règle d’association approximative)
Une règle d’association approximative est de la forme ( \ ) tel que sa
confiance est strictement inférieure à 1.
Définition 16 (Base propre de Luxenburger )
Une base propre de Luxenburger pour des règles d’association approximatives
est constituée de toutes les règles de la forme ( \ ) dont l’antécédent et la
séquence sont des fermés fréquents et ⊂ . Soit FF l’ensemble des sous-
ensembles d’items fermés fréquents d’un contexte formel, la base propre BP
pour les règles d’association approximatives est : BP {r : ( \ )tel que, ∈ FF ⊂et confiance(r)≥minconfiance}. Les règles de la base propre sont appelées "règles
d’association approximatives propres".
Luxemburguer démontre que la base propre pour les implications partielles n’est
pas minimale relativement au nombre de règles qu’elle contient et défini une base qui
est un sous-ensemble de la base propre. Cette base, appelée base de couverture. Cette
dernière est représentée en détail dans [Pasquier 2000].
Chapitre II Analyse de concepts formels
23
Exemple
Ensemble des fermés Règles d’association Le support La confiance
3/6
2/6
2/6
4/6
2/6
2/6
4/6
3/5
2/5
2/3
4/5
2/4
2/5
4/5
Table II.5 : Base propre de Luxenburguer extraite du contexte formel D
pour un min-support=2/6 et min-confiance=2/5
En conclusion, l’utilisation de l’ACF et la notion sous-jacente de fermé permet
de réduire le temps d’extraction des règles d’association et d’améliorer la pertinence
des résultats de l’extraction de fait qu’elle ne génère pas des règles d’association
redondantes.
II.6.2. La recherche d’information
La recherche d’information est une branche de l’informatique qui s’intéresse à
l’acquisition, l’organisation, le stockage, la recherche et la sélection d’information.
Pour une vision simple, la recherche d’information consiste à " trouver les documents
correspondent aux mots de la requête posée par l’utilisateur ". Pour ce faire, on est
amené à considérer une relation binaire Documents×Termes. Cette relation est souvent
représentée par une table avec en ligne des documents et en colonne des termes. Etant
donné une relation R, l’intersection d’une ligne et d’une colonne indique si un terme
‘t’ appartient ou n’appartient pas au document ‘d ’.
Chapitre II Analyse de concepts formels
24
ExempleEtant donné un ensemble fini de documents D, un ensemble fini de termes T et
une relation binaire R telle que pour un couple ( , ) ∈R, représente le fait que le
terme∈ T est présent dans le document ∈R t1 t2 t3 t4
d1 × ×d2 ×d3 × ×d4 × × × ×
Table II.6: Relation binaire terme-document
L’évidente analogue entre la relation binaire Objets×Propriétés caractérisant
l’ACF et une relation d’incidence de type Documents×Termes caractérisant la
recherche d’information à rapidement suscité un engouement certain pour l’utilisation
de l’ACF en recherche d’information. Dans ce cas les documents correspondent à des
objets formels et les termes d’indexation (descripteurs, éléments de thésaurus, etc.)
correspondent aux propriétés formelles [Priss 2000]. Les concepts formels résultant
d’une telle relation peuvent être interprétés comme des paires ({réponse}, {requête})
où la requête correspond à l’intension du concept tandis que la réponse correspond à
son extension. La relation de subsomption (relation d’ordre partiel) entre concepts
formels peut être considérer comme une relation de spécialisation/généralisation entre
requêtes [Messai et al 2005]
Nous pouvons remarquer que dans le contexte formel illustré dans la table II.4,
les seules informations que nous pouvons extraire c’est l’appartenance ou non
appartenance du terme au document. Cependant dans le domaine de la recherche
d’informations cette appartenance n’est pas toujours égale à 0 ou à1, mais appartient
plutôt à l’intervalle [0, 1].
Chapitre II Analyse de concepts formels
25
Ceci nous permet de nous placer dans le contexte flou fondé sur la théorie des
ensembles flous que nous détaillerons dans les sections qui suivent.
II.6.3. La classification
Dans le domaine de l’aide à la décision (informatique décisionnelle et entrepôt de
données) et du Data mining, la classification est utilisée pour répartir une population
d’individus (de client par exemple) en groupes homogènes selon un ensemble de
variables discriminantes (l’âge, le sexe, la profession, etc.). En fonction d’un objectif
fixé et connu (en fonction par exemple : du chiffres d’affaires, de réponses à un
mailing, etc.). L’arbre de décision est un outil de classification considéré parmi les
plus importantes méthodes de la machine Learning (machine d’apprentissage)
[Dunham 2003], [Quinlan 1993], [Tan 2006]. Plusieurs méthodes (algorithmes) ont été
proposées pour la construction de l’arbre de décision à partir d’une collection
d’enregistrements décrite par des vecteurs d’attributs.
Définition 17 (Arbre de décision)
Un arbre de décision est un outil d’aide à la décision et à l’exploration des
données. Il permet de modéliser simplement graphiquement un phénomène mesuré
plus au moins complexe. L’arbre de décision est une représentation par arbre des
valeurs finies d’une fonction selon des valeurs finies de ses attributs. Le crucial but est
de construire un arbre de décision relatif à une fonction, décrite partiellement par une
table (qui représente une relation binaire), afin qu’elle produira une meilleure
classification des données. L’arbre de décision est constitué par un ensemble de nœuds
et de segments. Chaque nœud de l’arbre de décision est étiqueté par un attribut nommé
attribut de décision, ce dernier représente un test, selon le résultat du test les
enregistrements sont divisés en plusieurs classes. Pour mieux illustrer l’induction des
arbres de décision, nous présentons l’exemple suivant :
Chapitre II Analyse de concepts formels
26
Exemple
Dans cet exemple nous allons présenter deux arbres de décision ou bien deux
classifications différentes de la fonction F :
A B C F(A, B, C)
Good Yes false yes
Good No false no
Bad No false no
Good No True yes
Bad Yes True yes
Table II.7 : table représentant la fonction F
Figure II.5 : Deux arbres de décision représentant la fonction F
Selon Belohlavek [Belohlavek 2006], l’analyse de concepts formels peut
apporter une solution au problème de classification. L’analyse de concepts formels
génère deux résultats, le premier c’est un treillis de concepts formels vu comme une
représentation hiérarchique de concepts formels. La seconde est les dépendances entre
attributs constituant une base non redondante appelée implication entre attributs. Un
treillis de concepts formels (sans le plus petit élément ou bien l’élément vide) peut être
vu comme une collection chevauchée d’arbres, alors un arbre de décision peut être
déduit en choisissons un de cette collection. Pour ce faire l’auteur propose un
truefalse
B
yes
yes
no
C
yes
no
yesno
no
B
yes
yesno
C
true
yes
no
B
yes
False
Agoodbad
Chapitre II Analyse de concepts formels
27
algorithme qui repose sur deux essentielles étapes. La première étape consiste à
construire le treillis de concepts, la seconde étape porte sur la sélection de l’arbre de
décision.
Dans la première étape, l’auteur génère le treillis de concepts d’une manière
itérative en rajoutant à chaque fois le concept voisin comme suit : le voisin direct de⟨ , ⟩= {⟨ , ⟩ / = ( ∪ { })∆∆ tel que ∈ P - }.
Dans la deuxième étape, l’auteur sélectionne l’arbre de décision qui répond à la
meilleure classification. D’abord pour chaque concept c=⟨ , ⟩, il calcule le nombre Lc
qui correspond au nombre de concepts voisins placés en dessous du concept considéré.
La sélection est réalisée d’une manière itérative débutant du concept ayant le plus
grand nombre de concepts voisins jusqu’au concept ayant le plus petit nombre de
concepts voisins.
II.7. Conclusion
Dans ce chapitre nous avons d’abord présenté l’analyse de concepts formels de
manière intuitive afin d’en faciliter la compréhension. Nous avons présenté par la suite
les notions mathématiques sous-jacentes à la théorie de l’analyse de concepts formels.
Nous avons essentiellement mis l’accent sur certaines propriétés algébriques des
opérateurs de dérivation de Galois notamment la propriété de fermeture. De nouveaux
opérateurs de dérivation ont aussi été présentés. Enfin nous avons présenté quelques
applications de l’analyse de concepts formels.
Il s’avère que l’analyse de concepts formels basée sur des relations Booléennes
(ACF classique) peut présenter certaines insuffisances car la réalité présente souvent
des valeurs qui ne sont pas Booléennes mais de diverses natures (floues,
intervalles,…). Pour cela, nous sommes amenés à considérer des cadres théoriques
plus appropriés comme la théorie des ensembles flous pour étendre
Chapitre II Analyse de concepts formels
28
l’analyse de concepts formels classique à l’analyse de concepts formels floue. A ce
titre, le chapitre suivant présente la théorie des ensembles flous.
Chapitre III Théorie des ensembles flous
29
III.1. IntroductionLa théorie des ensembles flous a été introduite par Lotfi Zadeh en 1965
[Zadeh 1965]. Zadeh étant automaticien, le domaine d’application initial des
ensembles flous était la commande floue. Cependant, les ensembles flous ont reçu une
attention dans de nombreux autres domaines et spécialités. Parmi les domaines
utilisant cette théorie, se trouve la représentation des connaissances imprécises,
incertaines, vagues, floues, manquantes. Les ensembles flous sont aussi utilisés pour
représenter des informations sous forme linguistique assimilable par un système expert
(les variables linguistiques).
Les ensembles flous ont permis aussi d’étendre l’analyse de concepts formels,
notamment en ce qui concerne la prise en compte des relations floues objet ×attributs et la génération d’opérateurs de fermeture et d’ouverture flous.
Dans la suite de ce chapitre, nous confondrons ensemble flou et sous-ensemble
flou et utiliserons indifféremment ces deus appellations sachant qu’un sous-ensemble
de manière générale est lui-même un ensemble.
III.2. Rappels sur la théorie des ensembles flousSoit U un univers de discours, un sous-ensemble flou F dans U est entièrement
défini par une fonction d’appartenance qui associe à chaque élément u de U son
degré d’appartenance à l’ensemble F. Ce degré d’appartenance est noté ( ).(généralement( ) ∈ [0, 1] ).
Un ensemble flou discret F peut être représenté comme suit :
F= ( )/ + ( )/ + + ( )/Ou bien F ={ ( )/ , ( )/ , … , ( )/ }
Le degré d’appartenance ( ) exprime la caractéristique de transition graduelle et
non brutale entre l’appartenance complète et la non appartenance totale de l’élément
à l’ensemble F tel que :
Chapitre III Théorie des ensembles flous
30
= 0 non appartenance totale ( n’appartient pas du tout à F).( ) : ∈]0, 1[ plus ( )se rapproche de 1, plus u appartient à F.
=1 appartenance complète ( appartient complètement à F).
Exemple 1
Supposons que nous voulions définir l’ensemble des personnes de taille
moyenne. En théorie des ensembles dits classiques, nous conviendrons que les
personnes de taille moyenne sont celles dont la taille est comprise entre 1m 60 et 1m
80. La fonction caractéristique de l’ensemble classique (non flou) des personnes de
taille moyenne donne "0" pour les tailles hors de l’intervalle [1m 60 et 1m 80] et "1"dans cet intervalle. C'est-à-dire, une personne mesurant 1m 59 ne sera pas considérée
de taille moyenne, alors qu’une personne plus grande d’un centimètre sera considérée
de taille moyenne
(voir Figure III. 1).
Les ensembles flous ont été introduits pour exprimer une transition graduelle
entre la non appartenance totale et l’appartenance complète. Aussi dans l’exemple 1,
l’ensemble flou des personnes de taille moyenne sera ainsi défini par une "fonction
d’appartenance" qui diffère d’une fonction caractéristique classique par le fait qu’elle
peut prendre n’importe quelle valeur dans l’intervalle [0,1]. A chaque taille possible
correspondra un "degré d’appartenance" dans l’ensemble flou des personne de taille
moyenne. Ce degré d’appartenance est généralement compris entre 0 et 1 (voir Figure
III. 2).
Figure III.1 : Fonction caractéristique Figure III.2 : Fonction d’appartenance
(Ensemble classique) (Ensemble flou)
1
1m60 1m80
0
1
()
01m70taille taille
Chapitre III Théorie des ensembles flous
31
Un ensemble flou comporte certaines caractéristiques, que nous présentons
succinctement ci-dessous.
Définition 1 (Le noyau)
Le noyau d’un sous-ensemble flou F de U, noté Noy(F), est l’ensemble de tous
les éléments qui lui appartiennent complètement, il est représenté par :
Noy(F)= {u ∈U | ( ) = 1}
Définition 2 (Le support)
Le support d’un sous-ensemble flou F de U, noté Supp(F), est l’ensemble de tous
les éléments qui lui appartiennent au moins un petit peu, il est représenté par :
Supp(F)= {u ∈U | ( ) > 0}
Définition 3 (La hauteur)
La hauteur d’un sous-ensemble flou F de U, notée h(F), est la valeur maximale
atteinte sur tout le support de F, d’où :
h(F)= Sup ∈ ( )
La hauteur d’un ensemble flou F est définie aussi comme étant : ‘la borne
supérieure de la fonction d’appartenance , aussi n’est pas nécessairement atteinte’
Sous-ensemble flou normalisé
Un sous-ensemble flou est dit normalisé si sa hauteur est égale à 1.
Définition 4 ( -coupe)
La coupe (resp. coupe stricte) de niveau de l’ensemble flou F noté (resp.
) est l’ensemble usuel composé des éléments dont le degré d’appartenance à F est
au moins égal (resp. strictement supérieur) à . Elles sont définies comme suit :
= {u ∈ U, (u)≥ }
= {u ∈ U, (u)> }
Chapitre III Théorie des ensembles flous
32
Les propriétés suivantes sont valides [Dubois 2000]
F1= noy(F) = Supp(F)
L’ensemble des coupes de niveau de F sont emboîtées au sens où :
Si > ′ ⊆Une coupe de niveau d’un ensemble flou a deux vues : une vue horizontale (voir
Figure III.3) et une vue verticale (voir Figure III.4).
E
1
1, , , ,…, sont les niveaux de coupe, tel que : 1> > > >…>
Figure III.3 : Vue horizontale d’ensemble flou : -coupes
:F = la trentaine
10 20 30 40 50 60 Age (en années)
F1=noy(F)
F0,5
Supp (F)
F0
Figure III.4 : Vue verticale d’une -coupe sur l’ensemble flou normalisé " la
trentaine "
0,5
1
Chapitre III Théorie des ensembles flous
33
Les coupes de niveau établissent un lien naturel entre ensemble flou et
ensemble usuel qui permet d’exprimer un ensemble flou par ses interprétations plus ou
moins exigeantes ou relaxées en termes de -coupes. Une propriété intéressante des -
coupes est l’ensemble des éléments propres d’une coupe qui définissent une partition
de l’ensemble flou.
Définition 5 (L’ensemble des éléments propres d’une coupe)
L’ensemble des éléments propres d’une coupe, noté ( ), est l’ensemble des
éléments de qui n’appartiennent à aucune coupe de niveau strictement supérieur à, on a alors :( )= {u| u∈ et ∀ ′ > , u ∉ }
Un ensemble flou peut être reconstitué à partir des ses -coupes en considérant
les éléments propres de chaque coupe.
Définition 6 (Cardinalité d’un ensemble flou)
La cardinalité d’un sous-ensemble flou F de U, est le nombre d’éléments
appartenant à F pondéré par leur degré d’appartenance. Pour un ensemble flou F fini,
on a donc :
Card (F)= ∑ ∈ ( ).Cette définition évalue " combien " d’éléments contient l’ensemble F. Elle supposeque :
- les degrés d’appartenance sont numériques,
- le support de F est fini.
Dans le cas de support infini, on peut utiliser l’intégrale de la fonction d’appartenance
d’un ensemble flou sur son support, s’il existe, on aura donc :
Card (F)=∫ (u) du
Chapitre III Théorie des ensembles flous
34
III.3. Les opérations ensemblistes flous
Les opérations usuelles définies sur les ensembles classiques (intersection, union,
complémentation, etc.). ont été généralisées aux ensembles flous. Les opérations
ensemblistes sur les ensembles flous sont généralement définies à partir des fonctions
d’appartenance.[Amroun 2008]
III.3.1. Intersection et union d’ensembles flous
Soient F et G deux ensembles flous. L’intersection (resp. l’union) des ensembles
F et G est un ensemble flou H dont la fonction d’appartenance est définie à partir des
fonctions d’appartenance de F et G comme suit :
Intersection: ∀ ∈U , ( ) = ∩ ( ) = ( ( ) ⊗ ( ))Union: ∀ ∈U , ( ) = ∪ ( ) = ( ( ) ⊕ ( ))
Où ⊗ désigne une t -norme,⊕ désigne une t -conorme.
Normes et co-normes triangulaires
Les normes triangulaires (t-normes) et les co-normes triangulaires (t-conormes)
permettent de généraliser les opérations ensemblistes d’intersection et d’union
respectivement (et par extension la conjonction et la disjonction de proposition) sur les
sous-ensembles flous. Pour que cette généralisation soit correcte, un certain nombre de
propriétés doivent être vérifiées. Les définitions et les propriétés respectives des
normes et conormes sont données ci-après.
Définition 7 (t-norme)
Une t-norme (appelée aussi norme triangulaire) est une fonction⊗:[0, 1]×[0, 1]→[0, 1] qui possède les propriétés suivantes ∀ , , , ∈ [0, 1]:
Commutativité : ( ⊗ ) = ( ⊗ )
Associativité : ⊗ ( ⊗ )= ( ⊗ ) ⊗ Monotonie : ( ⊗ )≤ ( ⊗ ) si ≤ ou ≤
Chapitre III Théorie des ensembles flous
35
1 est l’élément neutre : ( ⊗ 1)= ,
de plus elle assure que ∀ , ∈[0,1] , ( ⊗ )≤ et ( ⊗ )≤ .Définition 8 (t-conorme)
Une t-conorme (appelée aussi conorme triangulaire) est une fonction ⊕ :
[0,1]×[0,1]→[0,1] qui possède les propriétés suivantes∀ , , , ∈[0,1] :
Commutativité : ( ⊕ ) = ( ⊕ ),
Associativité : ( ⊕ ( ⊕ ))= ( ( ⊕ ) ⊕ ),
Monotonie : ( ⊕ ) ≤ ( ⊕ ) si ≤ ou ≤ ,
0 est l’élément neutre : ( ⊕ 0)= ,
de plus elle assure que ∀a, ∈ [0,1] , ( ⊕ )≥ et ( ⊕ )≥ .Il existe une infinité de normes et conormes, les plus courantes sont données dans le
tableau ci-dessous.
Norme : ( ⊗ ) Co-norme associée ( ⊕ ) Auteur
Min ( , ) Max ( , ) Zadeh
Max ( + -1, 0) Min ( + , 1) Lukasiewicz
/ + (1- )(a+b-ab) + - b - (1- )/1-(1- ) Hamacher
Si b=1
Si =1
0 Sinon
Si b=0
Si =0
1 Sinon
Weber
Table III.1 : Les principales normes et conormes triangulaires
Remarque :
le minimum est la plus grande t-norme de la famille des t -norme,
le couple Min /Max représente de nombreux avantages qui le rend particulièrement
intéressant (exemple : la simplicité de calcul, distributivité de l’opération
d’ - par rapport à l’intersection et l’union,
soit (F ∩ G) = ∩ et ( ∪ ) = ∪
Chapitre III Théorie des ensembles flous
36
l’inconvénient du minimum (resp. maximum) est de ne pouvoir discriminer entre
deux situations où des paires de degrés sont comparées avec une valeur minimale
(resp. maximale) commune. Ainsi, Min(0.7, 0.2)= Min(0.3, 0.2) = 0.2
III.3.2. Le Complément
Le complément d’un ensemble flou F est défini habituellement par μ ( ) =1 − μ ( ), ∀ ∈U. C’est la manière la plus simple pour exprimer l’évidente
condition que les éléments dont le degré d’appartenance à F est le plus élevé sont ceux
dont le degré d’appartenance à son complément est le plus bas.
III.3.3. Le produit cartésien
Lorsque les problèmes considérés sont décrits dans plusieurs univers de référence
U1, U2,…Un, il est plus intéressant de pouvoir raisonner dans un univers de référence U
global composé de chacun des univers initiaux. De ce fait, U correspond au produit
cartésien de U1, U2,… Un :
U= U1× U2,…× Un , et ses élément u sont des n-uplets : u= (u1, ...un)
Le produit cartésien de n sous-ensemble flous F1…..Fn définis respectivement sur
les univers de référence U1, U2,…Un est un sous ensemble flou F définis sur U par sa
fonction d’appartenance :∀ ∈U, = (u1, ...un) ∈U, μ ( ) = (μ ( ), … μ ( ) )
Chapitre III Théorie des ensembles flous
37
III.3.4. les relations floues et la composition de relations
Soient deux ensembles de référence U et V, une relation R est représentée entre
U et V par un sous-ensemble flou de U × V dont la fonction d’appartenance μR
est
définie par μR
U × V→ [0, 1]. La relation R est notée R (U, V).
La composition de deux relations floues R1 sur U×V et R2 sur V×W est une relation
R= R1 R2 de U×W dont la forme la plus utilisée est décrite par la fonction
d’appartenance μR
comme suit:∀( , ) ∈ U×W: μR
( , ) = ∈ (μ ( , ), μ ( , ))
Définition 9 (Composition Sup-Inf)
Soient F un ensemble flou dans U. La composition sup-inf de relation floue
R(U, V)est un ensemble flou G dans V, notée par G= R . La composition sup-inf est
définie par la fonction d’appartenance μR∘F comme suit : μR∘F ( )= {μ (u)μR( , ) Où = Sup et = Inf,
Soit R1(U, V) et R2 (V, W) deux relations floues. La composition sup-inf R1
R2est une relation d’appartenance μ R1∘ R2 donnée par :μ ( , ) = {μ ( , ) ∧ μ ( , )}, ∀(u, w)∈ U×V et ∀ v∈ V
Définition 10 (Relation inverse)
Soit R une relation floue sur U ×V. son inverse R -1 est une relation floue sur
V ×U tel que : ∀( , ) ∈V ×U, μ ( , )= μ ( , )Propriétés des relations floues
Une relation floue R (U, V) est dite :
1. Réflexive : Ssi ∀ ∈U , μ ( , )=1,
Chapitre III Théorie des ensembles flous
38
2. Symétrique : Ssi ∀ 1, 2 ∈U, µR( 1, 2)= µ
R( 2, 1)
3. t-norme transitive : ∀ 1, 2, 3∈ U, µR( 1, 3)≥ (µ
R( 1, 2) ⊗ µ
R( 2, 3))
III.3.5. L’égalité
Deux sous-ensembles flous F et G sont égaux si leurs fonctions d’appartenance
sont égales en tout point de U :
F=G ∀u ∈ U,μ ( )=μ (u)
III.3.6. L’inclusion
Une façon habituelle de définir l’inclusion d’un ensemble F dans un ensemble
G repose sur l’expression : (F⊆G) (∀ ∈U (u ∈ ) (u ∈ ))
Cette dernière expression s’étend canoniquement à deux ensembles flous F′ et G′
comme suit:
(F′ ⊆ ′) (∀ ∈ U, μ (u) ≤ μ (u))
Une définition plus exigeante de l’inclusion est donnée par :
(F′ ⊆ ′) (∀ ∈U, (u ∈ supp( ′)) ( ∈ Noy( ′)))III.4. Les implications floues
D’ordinaire, l’implication → exprime une liaison entre les valeurs des
propositions p et q. Elle rend vraie lorsque la proposition q est vraie ou quand la
proposition p est fausse, d’où les valeurs de vérité données dans la table III.2.
qp
Vrai Faux
Vrai Vrai Faux
Faux Vrai Vrai
Table III.2: table de vérité de l’implication classique (non flou) →Plusieurs approches d’extension de l’implication peuvent être envisagées lorsque
les propositions p et q prennent, non plus une valeur booléenne, mais une valeur floue
Chapitre III Théorie des ensembles flous
39
dansl’intervalle [0, 1]. Toute implication floue est une fonction (notée ) définie par :: [0,1] × [0,1] → [0,1]( , ) ( ) (1)
et elle est d’autant plus vraie (resp. fausse) que son résultat est proche de 1(resp. 0).
Les implications floues se divisent principalement en deux familles à savoir les S-
implications et les R-implications que nous présentons ci-après.
III.4.1. S-implications
L’appellation S-implication vient de l’expression anglaise Strong implication.
On définit la classe des S-implication (notée S) à partir de l’expression : ((non p) ou
q) de la manière suivante:
p q = (1- p⊕ q)
Où la disjonction (ou) est généralisée par une conorme (noté ⊕).
Il existe une infinité de S-implications, parmi lesquelles les trois les plus
courantes sont données dans la table III.3
Nom Symbole Valeur de vérité Conorme sous jacente
Kleene- Dienes K-D Max (1-p, q) ( ⊕ ) = Max ( , )Reichenbach Rb 1-p + p ∗ q ( ⊕ ) = p+q-p∗q
Lukaseiwicz Lu Min (1- p + q, 1) ( ⊕ ) = Min ( + , 1)Table III.3: les principales S-implications
De plus, l’ordre suivant sur les S-implication précédentes est valide.
(p K-D q) ≤(p Rb q) ≤(p Lu q)
Chapitre III Théorie des ensembles flous
40
L’implication de Kleene-Dienes est la plus petite des S-implications (puisqu’elle est
construite à partir de la plus petite des conormes). La plus grande (notée S-M) est
trouvée en prenant la co-norme de Weber, soit :
p→S-M q= (1 − ) si = 0si = 11 sinonRemarque
Comme pour l’implication usuelle, on a : ( 0) = (1-p ⊕ 0)=1-p
Les implications de cette classe sont leur propre contraposée car d’après laformule (1), on a : non non p = (1-(1-q) ⊕1-p)= (q ⊕ 1-p)= (1-p ⊕q)= (p q ).III.4.2. R-implication
La seconde classe d’implications floues est la R-implication, ainsi dénommées
parce qu’elles utilisent le principe de résiduation. Une R-implication (notée ) est
définie comme suit :
p R q = Sup [0, 1] {u ∈ [0, 1] | (p ⊗ u) ≤ } (2)⊗ étant une norme triangulaire.
Il y a donc une infinité de R-implications. Les plus courantes figurent dans la
Table III.4 avec la norme triangulaire (génératrice) qui leur est associée. L’implication
de Rescher Gaines peut être vue comme une R-implication particulière prenant en
argument des propositions floues en rendant un résultat Booléen, dérivant de la
formule voisine de la formule (2) à savoir :
p R-G q = {u∈ {0,1} | (p ⊗u)≤ }
= 1 si ≤0 sinonet ce, pour toute norme ⊗. De façon analogue aux S-implications, ces implications
peuvent être ordonnées : (p R-G q) ≤(p Gö q) ≤(p Gg q) ≤(p Lu q)
Chapitre III Théorie des ensembles flous
41
Nom Symbole Valeur de vérité Norme sous-jacentes
Gödel Gö1 si ≤q sinon
(p⊗ q)= min (p, q)
Goguen Gg1 si ≤q/p sinon
(p⊗ q)= p q
Lukasiewicz Lu1 si ≤1-p+q sinon
(p⊗ q)= max (p+ q-1,
0)
Table III.4 : les R-Implications les plus courantes
L’implication de Gödel est la plus petite R-Implication propre (i.e., en excluant
celle de Rescher Gaines), puisque elle est construite à partir de la plus grande norme
triangulaire. La plus grande (notée R-M) est celle construite à partir de la plus petite
norme (celle de Weber), soit :
p R-M q =1 si ≤si > = 11 si > < 1
où 1- désigne une valeur limite strictement inférieure à 1 (le comportement discontinu
de cette implication provient de celui de la norme triangulaire sous-jacente).
Quelques caractéristiques des implications floues
Les implications floues présentées précédemment généralisent toutes les
implications usuelles (appelées aussi implications matérielles), en ce sens que leur
résultat coïncide avec celui de l’implication usuelle quand les valeurs en entrée sont
vrai et/ou faux. En effet, pour les S-implications, 1 étant un élément absorbant et 0 un
élément neutre de toute co-norme, nous avons :
(faux S faux) = (1 ⊕ 0) = 1,
(vrai S vrai) = (0 ⊕ 1) = 1,
(vrai S faux) = (0 ⊕ 0) = 0,
(faux S vrai) = (1 ⊕ 1) = 1.
Chapitre III Théorie des ensembles flous
42
De façon analogue, pour les R-Implications et leurs contraposées :
(faux R faux) = (1 ⊕ 0) = 1,
(vrai R vrai) = (0 ⊕ 1) = 1,
(faux R vrai) = (1 ⊕ 1) = 1,
(vrai R faux) = (0 ⊕ 0) = Sup[ , ] {u | (1⊗ u)≤ 0 }
=Sup[ , ] {u | u ≤ 0 }= 0
Le fait que l’implication de Rescher-Gaines satisfait cette propriété est aisément
vérifiable.
Les deux classes d’implications floues considérées auparavant possèdent les propriétés
suivantes caractérisant les implications floues selon [Yager 1980].
P vrai =1,
faux q =1,
vrai q =1,
> ( q) ≥ ( r),
< ( q) ≥ ( q).
Sémantique associée aux implications floues [Amroun 2008]
Au-delà de ces aspects, il apparaît particulièrement important de s’intéresser à
la signification qui peut être attribuée aux diverses implications floues. Ceci permet en
particulier de procéder à un choix approprié et d’en expliciter le sens. Les S-
implications (Kleene-Dienes, Reichenbach et Lukasiewicz) présentent la
caractéristique de garantir un niveau de satisfaction minimal de (1-p). De plus, pour
l’implication de Kleene-Dienes, p joue le rôle d’un niveau d’importance attribué à la
conclusion q. En effet, si p est faible, on " voit " seulement les valeurs élevées de q,
contrairement au cas où p est élevé pour lequel q est " vue " sur une plage de valeurs
large (1-p est faible quand q est grand et donc l’intervalle [1-p, 1] sur lequel on " voit "q est grand).
Chapitre III Théorie des ensembles flous
43
Pour ce qui est des R-implications, la valeur de la prémisse p joue le rôle d’un
seuil qui conduit à la totale satisfaction quant il est atteint ou dépassé par la valeur de
la conclusion q et à une satisfaction partielle sinon. Dans ce dernier cas, le degré
obtenu ne dépend que de la conclusion avec l’implication de Gödel, varie avec le
ratio entre la valeur de la conclusion et celle de la prémisse avec l’implication de
Goguen et avec leur écart (ou distance) avec l’implication de Lukasiewicz.
III.5. Conclusion
Dans ce chapitre nous avons présenté en détail la théorie des ensembles flous.
Nous avons présenté différents opérateurs algébriques mais nous avons
particulièrement mis l’accent sur les implications floues qui sont à la base de la
spécification d’opérateurs de dérivation de Galois flous tel que nous allons le voir dans
le chapitre suivant.
Chapitre IV Analyse de concepts formels floue
44
IV.1. IntroductionDans le modèle de base proposé par Wille [Wille 1982], l’analyse de concepts
formels concerne des relations binaires et booléennes appelées contextes formels. De
plus, ce modèle repose sur les deux suppositions suivantes : i) la relation est
Booléenne et ne peut prendre une autre valeur que vrai ou faux, ii) l’information est
complète (parfaitement renseignée) c.à.d. il est toujours connu que l’objet possède ou
ne possède pas la propriété).
Il s’avère que l’analyse de concepts formels est souvent amenée à considérer des
contextes formels (relations) de diverses natures, modélisant des réalités concrètes
(mesure, observation, jugement, etc.). où peuvent apparaitre des données incomplètes
(imprécises, incertaines, floues, vagues, partiellement renseignées, ou même
manquantes). [Djouadi 2009]. Dans pareils cas, le modèle de base proposé par Wille
s’avère inapproprié. L’exemple de la table IV.1 illustre différents cas de données
incomplètes.
Propriétés
Objets
Jeune Anglais Marié
Rachid 1 0,9 oui
Fatima 0,7 ]0, 1] ?
Anis 0,6 0 non
Amina 1 [0.2, 0.4] (0.7 ;0.0)
Table IV.1 : Contexte formel flou
La première colonne de la table IV.1 contient des valeurs appartenant à
l’intervalle [0, 1]. Elle indique le degré de satisfaction de la propriété graduelle Jeune.
La seconde colonne indique le niveau de maîtrise de l’Anglais. Ce niveau peut être
connu de manière précise ou seulement apprécié sous forme d’intervalles. La troisième
colonne illustre la présence d’incomplétude et d’incertitude : Alors que Rachid est
marié et Anis ne l’est pas, rien ne peut être affirmé pour Fatima (cas totalement non
informé) d’où l’absence totale de valeur.
Chapitre IV Analyse de concepts formels floue
45
En modélisant l’état épistémologique d’une connaissance partielle (cas
partiellement informé) sur le mariage de Amina par la théorie des possibilités [Zadeh
1978], la paire (0.7 ;0.0) exprime que la possibilité que Amina ne soit pas marié est de
0.0 et de 0.7 qu’elle le soit.
A ce titre, plusieurs approches ont proposé d’étendre l’analyse de concepts
formels classique à des relations non Booléennes. Certaines de ces approches sont
basées sur la théorie des ensembles flous [Zadeh 1965] et permettent de modéliser des
relations floues où la notion de satisfaction de la relation est maintenant représentée
par un degré d (généralement d ∈ [0, 1]). Notre mémoire s’inscrit dans ce type
d’approches et nous nous limitons aux valeurs floues (comme celles de la première
colonne de la Table IV.1).
Dans cette section nous allons présenter les notions essentielles concernant
l’analyse de concepts formels concernant des contextes formels (relations) flous que
nous appellerons analyse de concepts formels floue.
IV.2. Contexte formel flou et Concepts formels flousL’analyse de concepts formels floue repose sur la notion de contexte formel flou.
Un contexte formel flou comporte une relation binaire floue entre un ensemble
d’objets et un ensemble d’attributs. Formellement, un contexte formel flou ou L-
contexte est un tuple K=(L, O, P, R) où la relation floue R ∈ L OP est une fonction
définie :O P L. Une relation floue R est représentée sous forme d’une table,
généralement les lignes représentent les objets et les colonnes représentent les
propriétés. Chaque cellule de la table exprime une valeur appartenant à L (L∈ [0, 1]).
L’ACF floue consiste à induire tous les concepts formels flous⟨ , ⟩ où est un
ensemble flou ( ∈ LO), est un ensemble flou ( ∈ LP) et △ = et △ = .
L’ensemble de tous les concepts formels flous est aussi équipé d’une relation d’ordre
définie comme suit :⟨ , ⟩ ⟨ , ⟩ ssi ⊆ ou ⊆ où l’inclusion floue est
Chapitre IV Analyse de concepts formels floue
46
ponctuellement définie par l’inégalité des fonctions d’appartenance respectives,
autrement dit : ⊆ ∀ ∈O : ( ) ≤ ( ).
Il a été aussi montré que, sous certaines conditions topologiques et algébriques,
l’ensemble de tous les concepts formels flous forme un treillis complet [Belohlavek
2005]. Parmi ces conditions, nous pouvons citer l’ouverture et la fermeture
topologique que nous définissons ci-après.
Définition 1 (Opérateur de fermeture flou)
Un opérateur de fermeture flou défini sur un ensemble U est une fonction :
LU LU satisfaisant ∀ U, V ∈ LU :
1- U⊆V ⇒ (U) ⊆ (V)
2- U ⊆ (U)
3- ( (U)) = ( )Définition 2 (Opérateur d’ouverture flou)
Un opérateur d’ouverture flou défini sur un ensemble U est une fonction :
LU LU satisfaisant ∀ U, V ∈ LU :
1- U⊆V⇒ (U) ⊆ (V)
2- (U) ⊆ U
3- ( (U)) = (U)
IV.3. ETAT DE L’ART
Il existe dans la littérature plusieurs approches concernant l’ACF floue. Burusco
et al [Burusco 1994] ont été les premiers auteurs à considérer des contextes formels
flous. Ils ont proposé l’utilisation d’une S-implication (de la forme ¬p ∨ q).
Chapitre IV Analyse de concepts formels floue
47
plusieurs approches sont venues par la suite [Pollandt 1997], [Latiri 2003],
[Belohlavek 2002], [Belohlavek 2005], [Ben Yahia 2007], [Medina 2009]. Toutes ces
approches reposent sur l’utilisation d’une algèbre résiduée. Avant de nous étendre sur
l’aspect algébrique, nous donnons les définitions suivantes :
IV.3.1. Rappels mathématiques
Définition 3 (Monoïde)
Etant donné un ensemble E et un opérateur ∗, on dit que (E, ∗, ) est un monoïde
si les trois propriétés suivantes sont vérifiées :
La stabilité : ∀ x, y ∈ E alors x∗y ∈ E
L’associativité : ∀ x, y, z ∈ E alors x∗(y∗ z)= (x∗ y)∗ z
L’élément neutre : ∃ ∈ E, ∀ x∈ E alors x∗ = ∗ =Un monoïde est dit régulier à gauche (resp. à droite) si ∀ x, y, z ∈ E, x∗ = x∗ z (resp.
y ∗x = z∗x) y=z
Un monoïde est dit commutatif ssi ∀ x, y ∈ E alors x∗ = ∗Définition 4 (Antitonie et isotonie)
Soient U et V deux univers, f et g deux opérateurs de fermeture, tels que f :
LU LV et g : LV LU. ∀A, B ∈ :
Isotonie : A⊆B ⇒ f g (A) ⊆f g(B)
Antitonie: A⊆B ⇒ f g (B) ⊆f g(A)
Définition 5 (Treillis résidué)
Un treillis résidué décrit par une structure algébrique L = (L, , ,∗, ) est un
treillis complet où (L, ∗) est un monoïde commutatif, est une implication floue et la
paire (∗, ) vérifie le principe de résiduation.
Chapitre IV Analyse de concepts formels floue
48
Définition 6 (Concept formel flou)
Un concept formel flou correspond à la paire ⟨ , ⟩ telle que ∆= et ∆= . On
peut remarquer que ∆∆= X et ∆∆ = , et sont donc des points fixes.
IV.3.2. Approches existantes
Il existe dans la littérature plusieurs approches dont la majorité est basée sur une
algèbre résiduée.
IV.3.2.1. Approche de Burusco et al.
Burusco et Fuentes Gonzales sont les premiers auteurs à avoir généralisé
l’analyse de concepts formels dans le cadre flou [Burusco 1994]. Leur approche est
basée principalement sur une S-implication de la forme pq. Soit L =⟨ , ≤, ′,⊕, 0, 1 ⟩une structure algébrique tel que ⟨ , ≤, 0, 1 ⟩ est un treillis complet, compris entre deux
valeur 0 et 1, ′ est un opérateur unaire de complémentation (on peut l’appelé aussi
opérateur de négation de Zadeh) et ⊕ est une t-conorme (rappelons nous que une t-
conorme ⊕ est un opérateur binaire, associatif, commutatif et il accepte 0 comme un
élément neutre) pour les deux ensembles flou ∈ (O est l’ensemble des objets) et∈ ( est l’ensemble des propriétés) l’auteur avait défini alors l’opérateur de
dérivation (. )∆ : LO L par :
∆( )= (∈ (x)′ ⊕R(x, ))
∆( )= (∈ (a)′ ⊕R(x, ))
Un treillis de concepts formel flous B (K ) est décrit par:
K={⟨ , ⟩ ∈ LO LP/ ∆ = et ∆ = , ∈ et ∈ }
Chapitre IV Analyse de concepts formels floue
49
Et définit un ordre partiel dans K entre ces concepts formels tel que : ⟨ , ⟩⟨ , ⟩ ssi ⊆ (ou ⊆ ).
Dans le papier [Burusco 1998] L’auteur avait démontré que si l’implication utilisée
vérifiait la condition: ≤ ≥ (pour , , ∈ O ), alors les deux
propriétés suivante sont vérifiées :
i) ≤ △ ≥ △, ∀ , ∈ LO
ii) ≤ △ ≥ △, ∀ , ∈ LP
Nous donnons dans ce qui suit un exemple dans lequel nous présentons deux concepts
formels générés par une S-implication.
Exemple
Soit le contexte formel suivant qui illustre une relation binaire entre les régions
{R1, R2, R3} (représentant les objets) et les propriétés du climat {chaud, froid,
pluvieux, humide}.
Climat
Région
chaud froid Pluvieux humide
R1 0.5 0.5 1.0 1.0
R2 1.0 0.0 1.0 1.0
R3 0.5 0.5 0.0 0.0
Table IV.2 : relation binaire floue régions/ climat
Nous appliquons dans ce qui suit une S-implication de Lukasievicz (notée par )définie par : p⊕q =Min(p+q, 1) et p q=Min(1, 1-p+q).
Chapitre IV Analyse de concepts formels floue
50
1) Soit (chaud/0.5, froid/0.5, pluvieux/1.0, humide/1.0)
∆( )= (∈ (x)′ ⊕R(x, ))
(R1)′ ⊕R(R1, )=
0.5 ⊕ 0.5 = min(0.5 + 0.5, 1.0) = 1.00.5 ⊕ 0.5 = min(0.5 + 0.5, 1.0) = 1.00.0 ⊕ 1.0 = min(0.0 + 1.0, 1.0) = 1.00.0 ⊕ 1.0 = min(0.0 + 1.0, 1.0) = 1.0=1.0
(R2)′ ⊕R(R2, )=
0.5 ⊕ 1.0 = min(0.5 + 1.0, 1.0) = 1.00.5 ⊕ 0.0 = min(0.5 + 0.0, 1.0) = 0.50.0 ⊕ 1.0 = min(0.0 + 1.0, 1.0) = 1.00.0 ⊕ 1.0 = min(0.0 + 1.0, 1.0) = 1.0=0.5
(R3)′ ⊕R(R3, )=
0.5 ⊕ 0.5 = min(0.5 + 0.5, 1.0) = 1.00.5 ⊕ 0.5 = min(0.5 + 0.5, 1.0) = 1.00.0 ⊕ 0.0 = min(0.0 + 0.0, 1.0) = 0.00.0 ⊕ 0.0 = min(0.0 + 0.0, 1.0) = 0.0=0.0∆( )= (R1/1.0, R2/0.5, R3/0.0)∆( ) = (∈ (a)′ ⊕R(x, ))
(chaud)′ ⊕R(x, chaud)=0.0 ⊕ 0.5 = min(0.0 + 0.5, 1.0) = 0.50.5 ⊕ 1.0 = min(0.5 + 1.0, 1.0) = 1.01.0 ⊕ 0.5 = min(1.0 + 0.5, 1.0) = 1.0
=0.5
(froid)′ ⊕R(x, froid)=0.0 ⊕ 0.5 = min(0.0 + 0.5, 1.0) = 0.50.5 ⊕ 0.0 = min(0.5 + 0.0, 1.0) = 0.51.0 ⊕ 0.5 = min(1.0 + 0.5, 1.0) = 1.0
=0.5
Chapitre IV Analyse de concepts formels floue
51
( pluvieux)′ ⊕R(x, pluvieux)=0.0 ⊕ 1.0 = min(0.0 + 1.0, 1.0) = 1.00.5 ⊕ 1.0 = min(0.5 + 1.0, 1.0) = 1.01.0 ⊕ 0.0 = min(1.0 + 0.0, 1.0) = 1.0
=1.0
(humide)′ ⊕R(x, humide)=0.0 ⊕ 1.0 = min(0.0 + 1.0, 1.0) = 1.00.5 ⊕ 1.0 = min(0.5 + 1.0, 1.0) = 1.01.0 ⊕ 0.0 = min(1.0 + 0.0, 1.0) = 1.0
=1.0
∆( ) =(chaud/0.5, froid/0.5, pluvieux/1.0, Humide/1.0)
Le concept formel obtenu est :⟨(chaud/0.5, froid/0.5, pluvieux/1.0, Humide/1.0), ( 1/1.0, 2/0.5, 3/0.0)⟩.2) Soit A=(1.0, 0.0, 1.0, 1.0)
Nous procédons de la même façon que 1 et nous trouvons :∆( )= (R1/0.5, R2/0.0, R3/1.0)∆( ) = (chaud/1.0, froid/0.0, pluvieux/1.0, humide/1.0)
Le concept formel est :⟨(chaud/1.0, froid/0.0, pluvieux/1.0, humide/1.0), (R1/0.5, R2/0.0, R3/1.0)⟩.Après l’approche classique de Wille [Wille 1982] sur l’analyse de concepts
formels, Burusco s’inscrit parmi les premiers autours qui ont ouvert la voie sur une
nouvelle théorie de l’analyse de concepts formels floue.
Néanmoins l’approche de Burusco a été critiquée par Belohlavek [Belohlavek
2005]. Il avait démontré que certaines propriétés utilisées dans cette approche ne
vérifient pas la propriété de fermeture. (Autrement dit la propriété d’extensivité "tout
ensemble est inclus ou égal à sa fermeture" n’est pas vérifiée par certaines S-
implication).
Chapitre IV Analyse de concepts formels floue
52
IV.3.2.2. Approche de Pollandt et Belohlavek
Pollandt [Pollandt 1997] et Belohlavek [Belohlavek 1998] sont parmi les
premiers auteurs qui avaient proposé d’utiliser un treillis résidué comme une structure
algébrique, ce qui revient à dire que leurs approches sont basées sur une R-implication.
Soit un L-contexte formel (L,O, P, R) ou O est l’ensemble des objets, P est
l’ensemble des propriétés et R une relation floue entre objet/propriété, pour les deux
ensembles flous ∈ LO et ∈ LP Pollandt et Belohlavek définissent l’opérateur de
dérivation (. )∆ : LO LP comme suit :
∆( )= (∈ (x) R(x, ))
∆( )= (∈ (a) R(x, ))
est une R-implication.∆( ) représente un degré de vérité de la propriété satisfaite par tous les objets de X
et ∆( ) représente un degré de vérité de l’objet satisfaisant toutes les propriétés de
. ⟨ , ⟩est un concept formel flou ssi ∆= et ∆= , et l’ensemble de ces concepts
formels flous forme un treillis complet défini par B (L,O, P, R)={⟨ , ⟩| ∆ =et ∆ = }. Toutes les propriétés citées ci-après sont démontrées dans [Belohlavek
1999]
Dans un treillis résidué on a les propriétés suivantes pour , , ∈ O, , ∈ Lp
i) ≤ ⊗ ≤ ⊗ (isotonie),
ii) ≤ ≤ (isotonie sur le second argument)
iii) ≤ ≤ (isotonie sur le premier argument)
on définit le degré de l’ensemble flou dans l’ensemble flou par , donné par
la formule suivante : d ( , )= ( )∈ ( ) [Goguen 1967]. ⊆ si , =1. Soient , ∈ LO alors : a) , ⊗ LB ( ) ⊗ (LB ≤ ( ≤ )b) , ⊗ UB ( ) ⊗ UB ( ) ≤ ( ≤ )
Chapitre IV Analyse de concepts formels floue
53
c) la paire ⟨(. )△, (. )△⟩ forme une connexion de Galois entre
l’ensemble des objets O et l’ensemble des propriétés P ssi : , △ ∈ ou, △ ∈ , △ = , △ tel que ∈ , ∈ et ∈Nous donnons dans ce qui suit un exemple dans lequel nous présentons deux concepts
formels générés par une R-implication.
ExempleConsidérons le contexte formel représenté dans la Table IV.2. Soit la R-
implication de Goguen (notée par ) définie comme suit := 1 si ≤/ sinonSoit à calculer :
∆( )= (∈ (x) R(x, ))
∆( )= (∈ (a) R(x, ))
1) Pour (chaud/0.5, froid/0.5, pluvieux/1.0, humide/1.0)
∆( )= (∈ (x) R(x, ))
(R1) R(R1, ) =
0.5 0.5 = 1.00.5 0.5 = 1.01.0 1.0 = 1.01.0 1.0 = 1.0=1.0
(R2) R(R2, )=
0.5 1.0 = 1.00.5 0.0 = 0.01.0 1.0 = 1.01.0 1.0 = 1.0=0.0
Chapitre IV Analyse de concepts formels floue
54
(R3) R(R3, )=
0.5 0.5 = 1.00.5 0.5 = 1.01.0 0.0 = 0.01.0 0.0 = 0.0=0.0
∆( )= (R1/1.0, R2/0.0, R3/0.0)
∆( )= (∈ (a) R(x, ))
(chaud) R( , chaud)=
1.0 0.5 = 0.50.0 1.0 = 1.00.0 0.5 = 1.0=0.5
(froid) R( , froid)=
1.0 0.5 = 0.50.0 0.0 = 1.00.0 0.5 = 1.0=0.5
(pluvieux) R( , pluvieux)=
1.0 1.0 = 1.00.0 1.0 = 1.00.0 0.0 = 1.0=1.0
(humide) R( , humide)=
1.0 1.0 = 1.00.0 1.0 = 1.00.0 0.0 = 1.0=1.0∆( ) = (chaud/0.5, froid/ 0.5, pluvieux/1.0, humide/1.0)
Le concept formel obtenu est :⟨ (chaud/0.5, froid/ 0.5, pluvieux/1.0, humide/1.0), ( 1/1.0, 2/0.0, 3/0.0)⟩.
Chapitre IV Analyse de concepts formels floue
55
2) Pour (chaud/1.0, froid/0.0, pluvieux/1.0, humide/1.0)
Suivant les mêmes étapes nous obtenons le concept formel suivant:
⟨(chaud/1.0, froid/0.0, pluvieux/1.0, humide/1.0), ( 1/0.5, 2/1.0, 3/0.0)⟩IV.3.2.3. Approche de Georgescu et Popescu
Inspiré de l’approche de Belohlavek, Georgesco [Georgesco 2004] avait étendu
l’analyse de concepts formels floue pour considérer le cas d’une algèbre non
commutative. Dans cette approche, on considère " ∗ "un opérateur de conjonction non
commutatif et deux implications résiduées :" "une implication résiduée à gauche
vérifie la propriété : ≤ ssi ∗ ≤ et " " une implication résiduée à droite
vérifie la propriété : ≤ ssi ∗ ≤ . Pour un ensemble d’objets flou on
définit deux ensembles de propriétés en appliquant deux opérateurs de dérivation ↑et ⇑, les deux opérateurs ↑, ⇑ : sont définis comme suit :↑( ) = ( ( ) ( , ))∈⇑( ) = ( ( ) ( , ))∈On a aussi:⇑( ) = ↑( ) = ( ) ∗ ( , )∈ = ( ) ∗ ( , )∈ = ( ) ∗∈( , )De même pour un ensemble de propriétés flou on définit deux ensembles d’objets↓ et ⇓.les deux opérateurs ↓, ⇓: sont donnés comme suit :↓( ) = ( ( ) ( , ))∈⇓( ) = ( ( ) ( , ))∈On a aussi cette relation:⇓( ) = ̅↓( ) = ( , ) ( ) = ( ) ( , )∈∈ .
Chapitre IV Analyse de concepts formels floue
56
Comparé au cas commutatif, on aura ↑⇓↑= ↑ et ⇓↑⇓= ⇓, résultant ainsi deux
opérateurs de ferméture (↑⇓, ⇓↑) et (⇑↓, ↓⇑), alors on dit que l’ensemble d’objets est
fermé par rapport à (↑⇓,⇓↑) et l’ensemble des propriétés fermé par rapport à (⇑↓, ↓⇑).
Selon l’auteur un concept formel dans ce cas étudié, doit avoir une extension et deux
intensions décrivant la même extension, alors un concept formel est décrit par un
triplet ( , , ) tel que ↑ = , ⇓ = , ⇑ = et ↓ = .Un treillis résidué est une structure algébrique tel que :
i) ⟨L, , , 0,1⟩ est un treillis limité par les deux valeurs 0 et 1.
ii) ⟨ ,∗ ,1⟩ est un monoïde.
iii) deux implications l’une résiduée à gauche (noté par " ") et l’autre résidué à
droite (noté par " ").
Dans un treillis résidué complet les propriétés suivantes sont
vérifiées [Georgescu 2004]:
i) ≤ ssi = 1 et ssi = 1ii) 1 = 1 = 1 ; 1 = 1 =iii) , sont des antitone sur le 1er argument et isotone sur le seconde argument.
iiii)∗ est isotone.
IV.3.2.4. Approche dite "one sided fuzzy formal context "
Cette approche est aussi basée sur un contexte formel flou (L,O, P, R)
définissant une relation floue R entre un ensemble fini d’objets O et un ensemble flou
d’attributs P appartient à l’intervalle [0, 1]. Dans le cadre de la recherche
d’information [Latiri 2003] considère une relation entre un ensemble fini de
documents (représentent les objets) et un ensemble flou de termes de corpus
(représentent les attributs) ces termes sont caractérisé par des poids qui appartiennent
généralement à l’intervalle [0, 1]. Les concepts formels résultants d’une telle relation
peuvent être interprétés comme des paires ({réponse}, {requête}) où la requête
correspond à l’intension du concept tandis que les réponses correspond à son extension
[Messai 2005]. Dans [Ben Yahia 2007], l’auteur avait introduit dans le contexte formel
une ligne supplémentaire qui correspond à une contrainte c prédéfinie par un
Chapitre IV Analyse de concepts formels floue
57
utilisateur. L’ensemble de ces auteurs sont basés dans leurs études sur une implication
de Rescher Gaïnes, cette dernière donne comme résultat
0 ou 1.
Nous donnons dans ce qui suit un exemple dans lequel nous présentons deux concepts
formels générés l’implication de Rescher Gaïnes.
ExempleConsidérons le contexte formel représenté dans la Table IV.2. l’implication de
Rescher Gaïnes (notée par ) est définie comme suit := 1 si ≤0 sinonSoit à calculer :
∆( )= (∈ (x) R(x, ))
∆( )= (∈ (a) R(x, ))
1) Pour (chaud/1.0, froid/0.0, pluvieux/1.0, humide/1.0)
∆( )= (∈ (x) R(x, ))
(R1) R(R1, ) =
1.0 0.5 = 0.00.0 0.5 = 1.01.0 1.0 = 1.01.0 1.0 = 1.0=0.0
(R2) R(R2, )=
1.0 1.0 = 1.00.0 0.0 = 1.01.0 1.0 = 1.01.0 1.0 = 1.0=1.0
(R3) R(R3, )=
1.0 0.5 = 0.00.0 0.5 = 1.01.0 0.0 = 0.01.0 0.0 = 0.0
Chapitre IV Analyse de concepts formels floue
58
=0.0
∆( )= (R1/0.0, R2/1.0, R3/0.0)
∆( )= (∈ (a) R(x, ))
(chaud) R( , chaud)=0.0 0.5 = 1.01.0 1.0 = 1.00.0 0.5 = 1.0
=1.0
(froid) R( , froid)=0.0 0.5 = 1.01.0 0.0 = 0.00.0 0.5 = 1.0
=0.0
(pluvieux) R( , pluvieux)=
0.0 1.0 = 1.01.0 1.0 = 1.00.0 0.0 = 1.0=1.0
(humide) R( , humide)=0.0 1.0 = 1.01.0 1.0 = 1.00.0 0.0 = 1.0
=1.0∆( ) = (chaud/1.0, froid/ 0.0, pluvieux/1.0, humide/1.0)
Le concept formel obtenu est :⟨ (chaud/1.0, froid/ 0.0, pluvieux/1.0, humide/1.0), ( 1/0.0, 2/1.0, 3/0.0)⟩.2) Pour (chaud/1.0, froid/1.0, pluvieux/1.0, humide/1.0)
Suivant les mêmes étapes nous obtenons le concept formel suivant:
⟨(chaud/1.0, froid/0.0, pluvieux/1.0, humide/1.0), ( 1/0.0, 2/0.0, 3/0.0)⟩IV.3.2.5. Approche basée sur les -coupes
Chapitre IV Analyse de concepts formels floue
59
Il existe des approches basées sur des coupes de niveau α pour des contextes
flous. Pour chaque α ∈ L positif, on peut définir la relation classique Rα=
{⟨ , ⟩:R⟨ , ⟩ ≥ α }, et en extraire les concepts formels ⟨ , ⟩ (on a alors ∀x ∈ ,∀ ∈ , ⟨ , ⟩ ∈ R). Un concept flou peut ensuite être reconstruit à partir de
l’ensemble de ses coupes de niveau α qui sont des concepts classiques à la coupe de
niveau α du contexte flou. Le choix de l’opérateur ∗ doit préserver l’égalité ∗=⟨ × ⟩ .
Exemple
Soit le contexte formel illustré dans la table IV.3 représentant une relation binaire
floue entre un ensemble des objets O= {x, y, z, t} et un ensemble des propriétés
P= {a, b, c, d}.
R a b c d
x 0.5 1.0 0.7 0.5
y 0.6 0.7 1.0 0.5
z 1.0 0.9 1.0 0.1
t 1.0 0.9 0.9 0.1
Table IV.3 : Table Représentant le contexte formel flou D
Chapitre IV Analyse de concepts formels floue
60
Pour =0.8, nous définissons le nouveau contexte formel D′ comme suit :
R (x, a)= 1 si ( , ) ≥ α0 sinon Pour chaque x∈O et a∈P
Le contexte D′ obtenu est un contexte formel non flou. Pour mieux le représenté.
Nous préférons remplacer 1 par une crois et 0 par un vide.
R a b c d
x
y
z
t
Table IV.4 : Table représentant le contexte formel non flou D′ pour =0.8
Liste des concepts formels⟨{∅}, { , , , }⟩ .⟨{ , , }, { } ⟩ .⟨{ , , }, { }⟩ .⟨{ , }, { , , }⟩ .⟨{ , , , }, {∅}⟩ .Table IV.5 : Table représentant les concepts formels du contexte D′
Chapitre IV Analyse de concepts formels floue
61
IV.4. Généralisation des opérateurs de dérivation deGalois au cas flou
Les opérateurs de dérivation de Galois définis dans la section II à savoir
l’opérateur de nécessité, l’opérateur de possibilité et l’opérateur de suffisance duale,
ont été étendus au cas flou. Cette génération correspond à des fonctions définies entre
les parties floues LO et LP comme suit :
∆( )= (∈ ( (x) R(x, ))
( )= ( ( )∈ ∗ R (x, ))
( )= (∈ R (x, ) ( ))
∇( )= (~ ( )∈ ∗ ~ R (x, ))
est une implication floue et ∗ est une conjonction floue.
Comme déjà indiqué dans [Dubois 2009], les paires ⟨ , ⟩ telles que =
et = caractérisent des sous contextes (i.e. qui n’ont en commun ni objets ni
propriétés) à l’intérieur du contexte initial.
La satisfaction des propriétés de fermeture (i.e. ∆( )= ( ( )∈ R( , ))) pour
la construction de Galois floue passant par le choix d’une structure algébrique
(L, , ,∗, ), appropriée. La composition d’opérateurs de nécessité et de possibilité
n’est pas symétrique (i.e.(.)NП ≠ (.)ПN, où (.)NП =((. )П)N [Djouadi 2009]. Les deux
théorèmes suivants caractérisent alors chacun une algèbre minimale pour la
construction d’un opérateur de fermeture et d’ouverture (.)ПN.
Théorème IV.1 [Djouadi 2011] : soit L= (L, , ,∗, ), la composition d’opérateurs
.(.)NП est un opérateur de fermeture flou si la paire (∗, ) vérifie la propriété :
b≤a (a ∗b) ∀ , ∈L
Chapitre IV Analyse de concepts formels floue
62
Théorème IV.2 [Djouadi 2011] : soit L=(L, , , ∗, ), la composition d’opérateurs
(.)ПN est un opérateur d’ouverture flou si la paire (∗, ) vérifie la propriété :
a ∗ ≤b ∀ , ∈ L.
Topologiquement parlant, (.)NП est un opérateur de fermeture qui fournit une
approximation haute, tandis que l’opérateur (.)ПN est un opérateur d’ouverture qui
fournit une approximation basse, de l’ensemble auquel on applique ces opérateurs. En
effet, ( )ПN⊆ ⊆ ( )NП. Les concepts formels ainsi obtenus correspondront à des
paires ⟨ , ⟩ tel que sera un point fixe au sens de la fermeture et sera un point fixe
au sens de l’ouverture ( = N, = П) ou inversement (( = П, = N)).
IV.5. Application de l’ACF floue en RI [Djouadi 2011]
L’application de l’analyse de concepts formels pour la recherche d’information
(RI) était parmi les 1èr soucis ambitieux des chercheurs. Un contexte formel décrit une
relation binaire entre un ensemble de documents (correspondant aux objets) et un
ensemble de termes (correspondant aux attributs). Alors que classiquement les seuls
degrés figurant dans cette relation sont 0 ou 1, traduisant la présence ou l’absence d’un
terme dans le document du corpus ; dans la pratique ces degrés appartient plutôt à
l’intervalle [0, 1]. Ceci nous permet de nous placer dans le contexte flou fondé sur la
théorie des ensembles flous.
L’analyse de concepts formels floue reflète la richesse de l’information que
peut représenter un contexte formel flou. Dans le cadre de la recherche d’information,
la façon dont les attributs d’un contexte formel sont exploités diffère en fonction de la
nature de l’information à extraire d’une part et des connaissances supplémentaires dont
on dispose sur ces attributs d’autre part. Cependant dans le domaine de la recherche
d’information nous disposons du poids d’un terme dans un document qui peut être une
information importante à intégrer dans le processus de découverte de règle
d’associatives entre termes ou encore lors de l’interrogation en RI.
Chapitre IV Analyse de concepts formels floue
63
Définition 7 (Poids d’un terme dans un document)
Le poids d’un terme dans un document est le produit de la fréquence d’apparition
du terme par la fréquence inversée du document, donné par la formule suivante :
Pij=tfij idfj.
tel que :tfij :"term frequency" mesure la représentation du terme ti dans le document dj
et idfj. : :"inverted document frequency" :mesure par contre le pouvoir de
discrimination du terme ti dans le document dj.
Définition 8 (Relation binaire floue)
Un contexte formel K (O, P, R) décrit une relation binaire entre un ensemble de
documents (correspondant aux objets) et un ensemble de termes (correspondant aux
attributs).comme le montre l’exemple suivant :
R t1 t2 t3 t4
d1 0.90 0.70 0.60 0.20
d2 0.70 0.45 0.76 0.70
d3 0.66 0.88 0.00 0.00
d4 1.00 0.66 0.60 0.73
Table IV.6 : Relation binaire floue termes/documents
L’ensemble des objets O ={d1, d2, d3, d4}, et l’ensemble des attributs P ={t1, t2, t3, t4}.
Le couple ⟨ , ⟩ ∈ R représente le fait que est présent dans le document avec un
degré appartient à l’intervalle [0, 1].
Dans [Latiri 2003], l’auteur propose deux manière pour évaluer de manière
pratique le degré d’appartenance entre terme /document R( , ), une première mesure
globale basée sur le poids d’un terme dans un document et la seconde qui est locale
basée sur la fréquence d’un terme dans un document. Selon l’auteur, les
expérimentations menées sur des corpus réels ont montré que la deuxième mesure
Chapitre IV Analyse de concepts formels floue
64
locale illustre plus fidèlement le degré d’appartenance d’un terme dans un document.
IV.6. Problématique
Au niveau méthodologique
Actuellement les approches existantes [Pollandt 1997][Belohlavek
1998][Georgesco 2004] utilisent une implication résiduée c.à.d. telle que ( ≤⇔ ∗ ≤ ). Le fait d’utiliser une implication résiduée restreint considérablement
le nombre d’implications éligibles pour l’ACF floue.
Notre première contribution se situe au niveau méthodologique et consistera à :
a) Prouver une algèbre minimale (plus faible que la résiduation). Une telle algèbre
induit un ensemble d’implications floues plus général (plus grand) que
l’ensemble des implications résiduées.
b) Déterminer les conditions requises pour la fermeture topologique floue de
l’opérateur (. )∆∆Au niveau opérationnel
L’ensemble des concepts formels flous (treillis de concepts formels) obtenu à
partir d’une implication residuée est généralement infini. Aussi, il n’existe pas
d’approche dans la littérature proposant la construction intégrale de ce treillis (car
infini). Pour éviter à avoir un treillis infini, les approches existantes proposent de
discrétiser L=[0, 1] par exemple [Belohlavek 2010] utilise un ensemble fini L={0.0,
0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1 }. D’autres approches [Chunzhi 2006] ne
calculent que la fermeture d’un sous-ensemble précis de concepts formels.
Notre deuxième contribution consistera à :
a) Mettre en évidence quelques implications floues qui engendrent un ensemble fini de
concepts formels
Chapitre IV Analyse de concepts formels floue
65
b) Proposer les algorithmes permettant de déterminer de manière effective et efficace
l’ensemble des concepts formels.
IV.7. ConclusionDans ce chapitre, nous avons présenté la théorie de l’analyse de concepts
formels floue en décrivant d’abord ses fondements mathématiques, par la suite nous
avons abordé différentes approches existantes. Comme nous avons mis l’accent sur la
généralisation des opérateurs de dérivation de Galois au cas flou, nous avons présenté
quelques théorèmes portant sur la notion de fermeture et d’ouverture floue. Enfin nous
avons présenté un domaine d’application de l’analyse de concepts formels floue et
nous avons opté pour le domaine de la recherche d’information.
L’analyse de concepts formels floue est un domaine très vaste. Ce chapitre n’a
été en fait qu’un aperçu sur ce domaine. Par conséquence, les notions que nous avons
voulu détailler sont celles qui s’apparentent à notre problématique. Nous avons
considéré seulement les valeurs floues singulières. C.à.d. des valeurs scalaires
appartenant à l’intervalle [0, 1].
Dans le prochain chapitre, nous allons présenter notre contribution qui apportera
des éléments de réponse aux différents points de la problématique énumérés dans la
section IV.6.
Chapitre V Contribution
66
V.1. Introduction
La notion cruciale de l’ACF est la relation binaire (nommée le contexte formel)
entre un ensemble d’objets et un ensemble d’attributs. Des approches basées sur la
logique floue ont été proposées pour induire les concepts formels flous du contexte
basé sur la connexion de Galois classique (i.e (. )∆∆). Actuellement, la tendance
générale de l’ACF consiste à utiliser une algèbre résiduée pour maintenir les propriétés
de fermeture. Dans ce qui suit, nous allons présenter notre contribution qui se décline
selon deux aspects. Un premier aspect méthodologique qui renforce les fondements
théoriques de l’ACF floue en élargissant les algèbres actuellement utilisées. Un
deuxième aspect opérationnel et constructif exhibe deux implications : La première est
l’implication de Gödel, La seconde est l’implication de Dienes Nilpotent, cette
dernière est une implication non résiduée. dans ces deux cas, nous proposeront les
algorithmes de construction de l’ensemble des concepts formels flous. En faisant
remarquer qu’aucune approche existante ne propose un algorithme complet de
construction de l’ensemble de concepts formels.
V.2. Proposition d’une algèbre minimale
En 1994 Burusco et Fuentes Gonzales [Burusco 1994] ont proposé une approche
basée principalement sur une S-implication. Cette dernière est de la forme pq.
En 2005 Belohlavek [Belohlavek 2005] a critiqué l’approche de Burusco et il a
démontré qu’elle ne vérifie pas la propriété de la fermeture. L’auteur propose alors
d’utiliser une implication résiduée (une R-implication).
Actuellement la majorité (pour ne pas dire toutes) des approches existantes
[Pollandt 1997], [Belohlavek 1998], [Latiri 2003], [Geogescu 2004], [Ben Yahia
2007], [Zhang 2007], [Medina 2009], etc. sont fondées sur une algèbre résiduée. Ces
auteurs sont essentiellement guidés par le souci de maintenir la propriété de la
fermeture de la connexion de Galois, sans autant poser la question sur la possibilité de
définir une algèbre minimale non résiduée et qui satisfait la propriété de fermeture.
Chapitre V Contribution
67
Le théorème V.1 prouve cette algèbre minimale. Cette dernière est plus faible
que la résiduation, comme elle peut élargir l’ensemble des implications éligibles
induites.
Avant de donner cette algèbre, nous définissons c’est quoi une implication floue.
Définition 1 (Une implication floue)
Une implication floue est une fonction (noté par ) définie de LL L
satisfaisant :
a) ≤ ′ pour ′ ≤b) ≤ ′ pour ≤ ′c) 0 0 =0 1 =1 1=1
d) 1 0 =0
Théorème V.1
Soit L=⟨ ,,, , ⟩ une algèbre floue où ⊗ représente une t-norme, (L, ⊗) un
monoïde et une implication floue. K = (L, O, P, R) un L-contexte formel, le couple⟨(. )△, (. )△⟩ est une connexion de Galois antitone et (. )△△ est un opérateur de
fermeture flou si la propriété suivante est satisfaite ∀ , ∈ L : ≤ ( ) .
Démonstration
Pour démontrer le théorème V.1 il suffit de montrer que la connexion de Galois
satisfait :
i) les propriétés de fermeture suivante pour , ∈ :
Cl1) ⊆ △△ ⊆ △△Cl2) ⊆ △△Cl3) △△△△ =1) la propriété CL1
Soient , ∈ (Pour , ∈ , c’est la même démonstration)⊆ ( ) ≤ ( ) ∀ ∈ O
Chapitre V Contribution
68
( ( ) ( , )) ≤ ( ) ( , ) ∀ ∈ O( ( ) ( , )) ( , ) ≤ ( ( ) ( , )) ( , )△( ) ( , ) ≤ ( △( ) ( , ))△( ) ( , )∈ ≤ ( △( ) ( , ))∈△△( ) ≤ △△( ) ∀ ∈ O
Alors △△ ⊆ △△2) la propriété CL2
Cette propriété est prouvée en considérant l’avantage de discrimination de
l’implication sur le premier argument et en utilisant la propriété ≤ ( )△( ) = ( ( ) ( , ))∈△( ) ≤ ( ( ) ( , )) ∀ ∈ O( ( ) ( , )) ( , ) ≤ ( △( ) ( , ))( ) ≤ ( △( ) ( , ))( ) ≤ ( △( ) ( , ))∈ ∀ ∈ O( ) ≤ ( △△( )) ∀ ∈ O⊆ △△3) la propriété CL3
△( ) ≤ ( ) ( , )( ) ( , ) ( , ) ≤ ( △( ) ( , ))( △( ) ( , )) ( , ) ≤ (( ( ) ( , ) ( , ))( , )En appliquant la propriété ≤ ( ) on aura△( ) ( , )∈ ≤∈ ( ( ) ( , ))△△△( ) ≤ △( )△△△ ≤ △…….(1)
Or nous avons ⊆ △△ . En remplaçant par △ on aura △ ⊆ △△△……(2)
(1) et (2) △ = △△△ donc △△ = △△△△
Chapitre V Contribution
69
Dans la pratique, nous pouvons donner ces deux contre exemples illustrant deux
implications non résiduées et satisfaisant la propriété ( ≤ ( ) ) donc
satisfaisant aussi les propriétés de la fermeture de connexion de Galois, pour dire
qu’une implication résiduée implique qu’elle respecte la propriété de fermeture de la
connexion de Galois, mais l’inverse n’est pas automatiquement vrai.
Exemple 1
Soit une algèbre floue L=⟨[0, 1],∧,∨ ,0,1, ∽⟩ et (∗, ) une paire d’opérateurs flous
vérifiant : ∽ = 1 − , ∗ = ∧ et = 1 si ≤(1 − ) sinonCette implication est l’implication de Dienes Nilpotent. Elle est remarquable, elle peut
être obtenue par la disjonction de l’implication de Gödel (lorsqu’ elle est égale à q) et
sa contraposé (c.à.d. ∽ =1- ). Nous pouvons remarquer facilement que cette
algèbre ne vérifié pas le principe de résiduation (c.à.d. ≤ ⇔ ∗ ≤).Démonstration
Pour démontrer que l’algèbre ci-dessus n’est pas résiduée il suffit de donner le
contre exemple suivant : Soient =0,2, =0,3 et =0,1 alors :≤ ⇔ ∗ ≤≤ (1 − ) ⇔ ∧ ≤0,2 ≤0.7⇔0,2≤0,1
Donc cette algèbre n’est pas résiduée
Chapitre V Contribution
70
Nous démontrons ci-après que cette algèbre vérifie la propriété ≤ ( )(donc les propriétés de fermeture de la connexion de Galois).
Démonstration
Nous avons : = 1 si ≤(1 − ) sinon1) ≤( ) = 1
=0
= donc ≤ ( )2) >2.1) (1- ) ≤( ) =
=1 et p≤1
Alors ≤ ( )2.2) (1- ) >( ) = (1- )
=1-(1- ) =
=
Alors ≤ ( )Ainsi nous avons démontré que cette algèbre vérifie la propriété ≤ ( )donc les propriétés de fermeture de la connexion de Galois sans être pour autant une
implication résiduée.
Chapitre V Contribution
71
Dans cette démonstration nous avons considéré tous les cas, or nous pouvons
ignorer les deux premiers cas (le cas où l’implication a comme résultat 1 ou q) car on
obtient l’implication de Gödel et cette dernière est résiduée.
Exemple2
Considérons nous une implication tri-valuée (noté par ) définie :
{0, , 1} {0, , 1} {0, , 1}. Comme la montre la Table V.1.
0 1 ( ) 0 1
0 1 1 1 0 0 0 0
1 1
1 0 0 1 1 1 1 1
Table V.1 : à gauche (resp. à droite) valeurs de vérité de (resp.de( ) )Il est facile de remarquer dans la Table V.1 que l’implication tri-valuée " "
vérifie la condition ≤ ( ) mais elle n’est pas résiduée.
Démonstration
Soit à vérifier la satisfaction du principe de semi-résiduation suivant ( ∗ ≤≤ ) tel que la conjonction floue ∗ vérifie la condition ∗1= .
Soit le contre exemple suivant : = 1, = = alors :
1∗ ≤ 1 ≤⇔ ≤ 1 ≤ (car selon la Table V.1 = )
Ce contre exemple montre que le principe de semi résiduation n’est pas vérifié par
l’implication tri-valuée alors elle n’est pas résiduée.
Chapitre V Contribution
72
Conclusion
Le théorème V.1 apporte une contribution théorique qui permet d’élargir
l’ensemble des implications floues éligibles à l’ACF floue. A ce titre les deux contre
exemples présentés montrent que nous pouvons avoir des algèbres non résiduées et qui
vérifient la propriété de fermeture et de connexion de Galois, il suffit que cette algèbre
respecte la propriété ≤ ( ) .
V.2. Génération des concepts formels flous
Pour la génération des concepts formels flous, nous commençons d’abord par
démontrer que pour certaines implications que nous allons déterminer, l’ensemble des
concepts formels est fini. Parmi ces implications : implication de Gödel et
l’implication de Dienes Nilpotent.
V.2.1. Finitude
Dans ce qui suit nous montrerons que l’ensemble des concepts formels généré
par l’implication de Gödel ou Dienes Nilpotent est fini.
Proposition 1
Soit K = (L, O, P, ) un L-contexte tel que L=[0, 1], O est l’ensemble des
objets, P est l’ensemble des propriétés, est une relation binaire. L’ensemble des
concepts formels est fini pour l’implication de Gödel.
Démonstration
Puisque l’ensemble de toutes les intensions est isomorphe à l’ensemble de toutes
les extensions il suffit de montrer que l’ensemble des extensions est fini.△△( ) = ( △( )∈ ( , ))= 1 si △( ) ≤ ( , )( , ) sinon∈
Chapitre V Contribution
73
Ainsi il apparait que △△( ) ∈ { , } ∪ {1} tel que , appartient au
contexte formel. Puisque le contexte formel est fini nous pouvons déduire que
l’ensemble des extensions est fini. Donc l’ensemble des concepts formels est fini.
Pour déterminer tous les fermés, il suffit d’énumérer les valeurs de l’ensemble L
dans { ( , ), ∈ , ∈ } du majorant au minorant de l’ensemble des concepts
forˇmels flous (ou inversement). La proposition suivante caractérise ces éléments.
Notons par 1 , 1 , 0 et 0 les ensembles flous particulier définis tel
que :1 ( )=1 et 0 ( )=0 ∀ ∈ (resp. 1 ( )=1 et 0 ( )=0 ∀ ∈ , notons aussi que :
Oˆ( ) (resp.Oˇ( )) tel que Oˆ( ) = ( , )∈ (resp.Oˇ( ) = ( , )∈ ∀ ∈,) et Oˆ( ) (resp.Oˇ( )) tel que Oˆ( ) = ( , )∈
(resp.Oˇ( ) = ( , )∈ ∀ ∈ )
Proposition 2
Pour l’implication de Gödel, le majorant et le minorant de l’ensemble de
concepts formels flous B(K ) est donné par :(⟨ , ⟩ B(K ))=⟨Oˆ(O ) , 1 ⟩et (⟨ , ⟩ B(K ))=⟨ 1 ,Oˆ(P )⟩
Démonstration(. )△△est isotone alors : ∀ ∈ : 0≤ O ≤1 0△△( ) ≤ △△( ) ≤ 1△△( )i) Déterminons l’ensemble 0△△0△( ) = (∈ 0 ( , )0△△( ) = (∈ (∈ 0 ( , )) ( , ))= (∈ 1 ( , )) puisque (0 )= 1 ∀ ∈= ( , )∈ car (1 )= 1∀ ∈
Chapitre V Contribution
74
ii) Déterminons l’ensemble 1△△1△△( ) = (∈ (∈ 1 ( , )) ( , ))= (∈ (∈ ( , ) ( , ))= 1 = 1∈
correspond à l’implication de Gödel et Dienes Nilpotent (autrement dit, les
démonstrations i) et ii) sont vérifiées soit pour Gödel soit pour Dienes Nilpotent.)
Proposition 3 [Djouadi 2010]
Soient deux sous ensembles X, Y∈LO (resp. A, B∈LP) tel que X⊆Y, si Y⊆ △△(resp. B⊆ △△) alors △△ = △△ (resp. △△ = △△).
Cette proposition sera utilisée dans notre algorithme. Elle est utile pour diminuer
le nombre de fermés éventuels.
Démonstration
En utilisant les propriétés de fermeture CL1, CL2 et CL3 définies précédemment.
Selon CL1 nous avons :
X⊆Y △△ ⊆ △△……….(1)
CL2 et CL3 :
Y⊆ △△ △△ ⊆ △△△△△△ ⊆ △△ .…(2)
(1) et (2) △△ = △△
Chapitre V Contribution
75
V.2.2. Présentation de l’algorithmeL’algorithme proposé est conçu pour générer tous les concepts formels. Il est
déjà établi que l’ensemble des intensions est isomorphe à l’ensemble des extensions. Il
n’est donc pas nécessaire de générer l’ensemble des intensions et extension en même
temps. L’algorithme proposé est organisé selon deux procédures.
1- Une procédure principale GENERATION-INTENT-SET définit le Bottom et Top,
Comme elle initialise l’ensemble des intensions INTENT-SET et fait appel à une
procédure récursive RECURSIVE-CLOSURE.
Bottom : correspond à la plus petite intension, qui est égale à ˆ( ).
Top : correspond à la plus grande intension qui est égale à 1 ( ).
La procédure principale est donnée comme suit :
Algorithm GENERATION-INTENT-SET
Input: le contexte flou K =(L,O,P,R)
Output : INTENT-SET ensemble des intensions floues
Begin
1: Top ( ) 1 ∀ ∈ P ;
2: Bottom ( ) Oˇ ; ∀ ∈ P ;
3: INTENT-SET {Top} {Bottom} ;
4: RECURSIVE-CLOSURE (Bottom) ;
End
2- Une procédure récursive RECURSIVE-CLOSURE fait appel à elle-même pour
générer tous les concepts formels éventuels. Les notations suivantes sont utilisées par
l’algorithme
Chapitre V Contribution
76
DIR-SUCC (Closed, aj) : c’est une fonction qui retourne le successeur directe de la
variable closed par rapport à la propriété aj. Le résultat (noté V) est donné comme
suit :
V(aj) = si > closed (aj) et ′ : > ′> closed (aj) sinon.
V(aj) = closed(ak) pour k≠j.
V(aj) = closed (aj) pour closed(aj)= Oˇ (aj).
La procédure récursive RECURSIVE-CLOSURE utilise la proposition 3 pour
diminuer le nombre de fermés éventuels (noté dans l’algorithme par la variables
closed).
Successor : correspond au successeur direct du dernier fermé (closed).
Closure : contient la fermeture du Successor.
Next : correspond au successeur direct de la dernière fermeture (Closure).
FLAG : une variable Booléenne utilisée pour éliminer les fermés déjà comptés.
Algorithm RECURSIVE-CLOSURE (closed)
Begin
1: j 1;2: FLAG TRUE
3: While (j≤ )and FLAG Do
4: Begin
5: Next DIR-SUCC(closed, )
6: While (Next≠ Oˇ ( ) and FLAG do
7: Begin /*il existe un successeur directe*/
8: successor closed ;
9: successor ( ) DIR-SUCC(closed, ) ;
10: closure (successor)△△ ;
11: if¬(closure ∈ INTENT-SET)
12: Then
13: INTENT-SET INTENT-SET {closure} ;14: RECURSIVE-CLOSURE(closure) ;
Chapitre V Contribution
77
15: Next DIR-SUCC(closed, ) ;
16: Else
17: FLAG False ;
18: end If
19: End While
20: j++ ;
21: End While
End.
Exemple illustratif
Soit la relation floue R, entre un ensemble de régions et le climat, illustrée dans
la table V.2 tel que :
- l’ensemble d’attributs P = {chaud, pluvieux, humide}, les abréviations associées
sont respectivement {C, P, H},
- l’ensemble des objets O = {Région1, Région 2, Région 3, Région 4}, les abréviations
associées sont respectivement { R1, R2, R3, R4},
R Chaud Pluvieux humide
Région 1 0.0 0.2 0.3
Région 2 1.0 0.9 0.6
Région 3 0.0 0.4 0.1
Région 4 0.7 0.9 0.5
Table V.2 : contexte formel illustrant la relation R
L’algorithme se déroule comme suit :
Etape1 : Initialisation
La variable m=3.
Top et Bottom sont définis : Top= (C/1.0, P/1.0, H/1.0), Bottom= (C/0.0, P/0.2,
H/0.1).
Chapitre V Contribution
78
INTENT-SET= {(C/1.0, P/1.0, H/1.0)}∪ {(C/0.0, P/0.2, H/0.1)}.
Etape 2 :
La procédure RECURSIVE-CLOSURE pour closed=(C/0.0, P/0.2, H/0.1) est
lancée. La variable Next alors prend la valeur 0.7 correspondant au successeur direct
du degré 0.0 (par rapport à l’attribut a1 ou bien C de la relation R). On assigne à la
variable successor (C/0.0, P/0.2, H/0.1) à la ligne 8 de l’algorithme, par contre à la
ligne 9, la variable successor devient (C/0.7, P/0.2, H/0.1). A la ligne 10 la fermeture
(closure) est calculée et donne (C/0.7, P/0.9, H/0.5).Ce dernier est rajouté à la liste
INTENT-SET. La procédure RECURSIVE-CLOSURE est lancée à nouveau pour
(C/0.7, P/0.9, H/0.5).
Etape 3 : Mi-parcours
La procédure RECURSIVE-CLOSURE est lancée pour (C/0.0, P/0.4, H/0.1), la
variable Next reçoit la valeur 0.7 correspondant au successeur direct du degré 0.0 (par
rapport à l’attribut a1 ou bien C de la relation R ). A la ligne 10 la fermeture du (C/0.7,
P/0.4, H/0.1) est calculée et la valeur (C/0.7, P/0.9, H/0.5) est associée. On constate
que cette dernière est déjà calculée et appartient à l’ensemble INTENT-SET, alors la
valeur FLAG reçoit la valeur "Faux".
Etape 4 :
La procédure arrive à sa fin lorsque tout les fermés potentiels sont générés.
La liste ci-dessous représente la liste des concepts formels correspondant au
contexte R décrit par la Table V.3
Chapitre V Contribution
79
Liste des concepts formels⟨(0.0 0.2 0.1),(1.0 1.0 1.0 1.0)⟩; ⟨(0.0 0.2 0.3) , (1.0 1.0 0.1 1.0)⟩⟨(0.0 0.2 0.5),(0.3 1.0 0.1 1.0)⟩; ⟨(0.0 0.2 0.6),(0.3 1.0 0.1 0.5)⟩⟨(0.0 0.4 0.1),(0.2 1.0 1.0 1.0)⟩; ⟨(0.0 0.9 0.1),(0.2 1.0 0.4 1.0)⟩⟨(0.0 0.9 0.5),(0.2 1.0 0.1 1.0)⟩; ⟨(0.0 0.9 0.6),(0.2 1.0 0.1 0.5)⟩⟨(0.7 0.9 0.5),(0.0 1.0 0.0 1.0)⟩; ⟨(1.0 0.9 0.5),(0.0 1.0 0.0 0.7)⟩⟨(1.0 0.9 0.6),(0.0 1.0 0.0 0.5)⟩; ⟨(1.0 1.0 1.0),(0.0 0.6 0.0 0.5)⟩TableV.3 : liste des concepts formels de l’implication de Gödel
Implication de Dienes Nilpotent
Implication de Dienes Nilpotent est une implication non résiduée, La liste ci-
dessous représente la liste des concepts formels correspondant au contexte R décrit par
la
Table V.4 en appliquant l’implication Dienes Nilpotent
Liste des concepts formels flous⟨(0.0 0.2 0.1),(1.0 1.0 1.0 1.0)⟩; ⟨(0.0 0.2 1.0),(0.3 0.6 0.1 0.5)⟩⟨(0.0 0.9 0.1),(0.2 1.0 0.4 1.0)⟩; ⟨(0.0 1.0 0.1),(0.2 0.9 0.4 0.9)⟩⟨(0.0 1.0 1.0),(0.2 0.6 0.1 0.5)⟩; ⟨(1.0 0.9 0.5) , (0.0 1.0 0.0 0.7)⟩⟨(1.0 0.9 0.6),(0.0 1.0 0.0 0.5)⟩; ⟨(1.0 1.0 0.5),(0.0 0.9 0.0 0.7)⟩⟨(1.0 1.0 0.6),(0.0 0.9 0.0 0.5)⟩; ⟨(1.0 1.0 1.0),(0.0 0.6 0.0 0.5)⟩Table V.4: liste des concepts formels flous de Dienes Nilpotent
V.4. ConclusionDans ce chapitre, nous avons défini une algèbre minimale et nous avons montré
qu’elle respecte les propriétés de fermeture et les propriétés sous-jacentes de
connexion de Galois, en se basant sur l’implication résiduée de Gödel et l’implication
non résiduée de Dienes Nilpotent, nous avons montré la finitude du treillis des
concepts formels généré par ces deux implications. Nous avons terminé par un
exemple illustratif.
Chapitre VI Conclusion et perspectives
80
VI.1. ConclusionToutes les approches existantes [Pollandt 1997], [Belohlavek 1998], [Georgesco
2004] utilisent une implication résiduée. Dans ce mémoire nous avons défini une
algèbre non résiduée, qui délivre un ensemble d’implications floues plus générales,
cette algèbre vérifie la propriété ≤ ( ) . Nous avons montré que cette
algèbre respecte les propriétés de fermeture ainsi que celle de connexion de Galois. Par
la suite nous avons étudié deux implications floues qui définissent un ensemble fini de
concepts formels.
La première est l’implication de Gödel, l’avantage de cette dernière c’est que son
espace de fermeture est un ensemble fini, elle fournit une méthode constructive
efficace pour l’ensemble de tous les fermés.
La seconde est l’implication de Dienes Nilpotent, cette dernière n’est pas
résiduée, mais elle respecte les propriétés de fermeture.
VI.2. PerspectivesLe sujet abordé dans ce mémoire ouvre diverses perspectives, nous en présentons
quelques une.
Dans ce mémoire nous avons considéré un contexte formel qui représente une
relation binaire entre un ensemble d’objets et un ensemble de propriétés tel que la
valeur de cette relation appartient à [0, 1], la prochaine problématique que nous allons
traiter portera sur la construction d’un treillis de concepts formels pour un contexte
formel représentant une relation binaire entre un ensemble d’objet et un ensemble de
propriété et chaque valeur de cette relation est un intervalle [ , ] tel que ≤ et∈[0, 1],∈[0, 1].
Dans le cadre de la recherche d’information nous avons vu que seule
l’implication appliquée est celle de Rescher Gaïnes qui prend en argument des
Chapitre VI Conclusion et perspectives
81
propositions floues en rendant un résultat booléen. Il peut être plus intéressent
d’utiliser d’autre implications vues dans le chapitre III.
Annexes
82
Nous avons utilisé le langage de programmation Borland C++ Builder sous Windows
XP, cet outil est basé sur le concept de programmation orienté objet, comme il assure
une programmation modulaire.
Dans ce qui suit nous présentons les résultats obtenus en appliquant l’implication de
Gödel et Dienes Nilpotent sur le contexte formel représenté par la table V.2.
Résultat de l’application de Gödel pour le contexte formel représenté par la table V.2
Annexes
83
1. Résultat de l’application de Dienes Nilpotent pour le contexte formel représenté parla table V.2
84
Bibliographie[Agrawal 1993]: R. Agrawal, T. Imielinsky, and A. Swami: "Mining association rules
between sets of items in large databases". In proceeding of the 93
ACM SIGMOD international Conference on management of Data
(SIGMOD’93), pp 207-216, 1993.
[Agrawal 1994]: R.Agrawal et R.Srikant: "Fast algorithms for mining association rules
in large data base". In proceding of the 20th international conference
on very large Data bases (VLDB 94), pp 478-499,1994.
[Amroun 2008]: K. Amroun : "Découverte des dépendances fonctionnelles floues dans
des modèles relationnels sous imprécision". Mémoire de magister,
2008.
[Belohlavek 1999]: R. Belohlavek: "Fuzzy Galois connections". Math logic quart, pp 497-
504, 1999.
[Belohlavek 2002]: R. Belohlavek: "Fuzzy Relational Systems: Foundations and
Principles". Kluwer academic/ plunium publisher, New York, 2002.
[Belohlavek 2004 a]: R. Belohlavek: "Concept lattices and order in fuzzy logic". Ann Pure
Appl logic 128 (1-3), pp 277-298, 2004.
[Belohlavek 2004 b]: R. Belohlavek, M. Chlupova, V. Vychodid: "Implications from data
with fuzzy attributes". AISTA 2004 in cooperation with IEEE
computer society proceedings, ISBN 2-9599776-8-8, 2004.
[Belohlavek 2005]: R. Belohlavek, V. Vychodil: "What is a fuzzy concept lattice". Proc
CLA’05, Olomouc Czech republic, pp 34-45, 2005.
[Belohlavek 2010]: R. Belohlavek, B. De Baets, J. Outrata and V. Vychodil: "Fixpoints of
a fuzzy closure operatos". IEEE Transactions on fuzzy systems, Vol
18, pp 546-557. 2010.
85
[Ben Yahia 2007]: S. Ben Yahia, S. Ayouni :"Extraction compact and information
lossless set of fuzzy association rules". Fuzzy systems conference
2007, fuzzy-IEEE 2007. IEEE international, London, pp 1-6.
[Brin 1997]: S. Brin, R. Motwani, J. D. Ullman et S. Tsur: "Dynamic itemset
counting and implication rules for market data". In proceeding of the
1997 ACM SIGMOD international conference on management of
Data (SIGMOD’97), pp 255-264, 1997.
[Burusco 1994]: A. Burusco, R. Fuentes-Gonzalez: "The study of the L-fuzzy concept
lattice". Mathware and Soft computing 3, pp 209-218, 1994.
[Burusco 2001]: A. Burusco , R. Fuentes Gonzales: "Contexts with multiple weighted
values". International J. uncertainty, fuzziness and knowledge based
systems, 2001.
[Chen 1996] : M. Chen, J. Han et P.Yu: "Au overview from a data base perspective".
IEEE transaction on knowledge and Data engineering, 1996.
[Chunzhi 2006] : L. Chunzhi Y. Yajun: "An algorithm for fuzzy concept lattices
building with application to social navigation". School of Mathematics
and computer engineering, Xihua university, Chengdu 610039,
P.R.China, 2006.
[Djouadi 2009] : Y. Djouadi, H. Prade, D. Dubois : "Différentes extensions floues de
l’analyse formelle de concepts". Journée des treillis à Clermont-
Ferrand, 2009.
[Djouadi 2010] : Y. Djouadi, H. Prade : "Possibility-theoretic extension of derivation
operators in formal concept analysis over fuzzy lattices". Springer
science + Business media LLC, 2011.
[Djouadi 2011] : Y. Djouadi. "Extended Galois Derivation Operators for Information
Retrieval Based on Fuzzy Formal Concept Lattice". SUM'2011,
International Conference on Scalable Uncertainty Management,
Dayton, USA, 10-12 October 2011. LNCS 6929, pp 346-358.
86
[Düntsch 2003]: I. Düntsch, G. Gediga: "Approximation operators in qualitative data
analysis". Theory and application of relational structure as Knowledge
instrument, in computer science. Vol. 2929, pp 216-233, 2003.
[Dubois 2000]: D. Dubois, H. Prade: "Fundamentals of fuzzy sets". In kluwer
academic publishers, 2000.
[Dubois 2009]: D. Dubois, H. Prade: "Possibility theory and formal concept analysis
in information systems". Proc IFSA/ EUSFLAT’09, Lisbon, Portugal,
2009.
[Gardarin 1998]: G. Gardarin, P. Pucheral et F. Wu: "Bitmap based algorithms for
mining association rules". In Acts, des 14èmes journées des Bases de
données avancées (BDA’98), pp 157-175,1998.
[Ganter 1999]: B. Ganter, R. Wille: "Formal Concept Analysis". Mathematic
foundation. Springer- verlag, Berlin, 1999.
[Georgescu 2004]: G. Georgescu, A. Popescu: "Non dual fuzzy connection". Archive for
mathematical logic 43, 1009, 2004.
[Gunopulos 1997]: D. Gunopulos, R. Khardon, H. Mannila et H. Toivonen: "Data mining,
hypergraph transversals, and machine learning". In proceedings of the
16th ACM SIGACT-SIGMOD-SIGART, symposium on principles of
data base systems (PODS’97), pp 209-216, May 1997.
[Houtsma 1995]: M. Houtsma et A. Swami: "Set-oriented mining for association rules
in relational databases". In proceeding of the 11th international
conference on Data engineering (ICDE’95), pp 25-33, 1995.
[Järyinen 2007] : J. Järvinen, Jari Kortelainen : "A unifying study between modal-like
operators, topologies and fuzzy sets ". Turku center for computer
science (TUCS), university of Turku finland. Laboratory of applied
mathematics, Lappeenranta. University of technology, P.O. Box 20,
FI53851 Lappeenranta, Finland.
87
[Kegun 2004] : Q. Kegun, P. Zheng. "On topological properties of fuzzy rough sets".
Department of applied mathematics, Southwest Jiao tong, Chengdu,
Sichuan 610031, China college of computers and mathematical-
physical science,Xihua university, Chengdu, Sichuan, 610039, China.
[Latiri 2003] : C. Latiri, J. P Chevallet, S. Elloumi, A. Jaoua : "Une extension de la
connexion de Galois pour la recherche d’information". Revue
Cepadues Toulouse, France, 2003.
[Luxenburger 1991] : M. Luxenburger : "Implications partielles dans un contexte".
Mathématique, informatique et sciences humaines, 29(113), pp 35-55,
1991.
[Mannila 1994]: H. Mannila, H. Toivonen, et A. Verkamo : "Efficient algorithms for
discovering association rules. In AAAI’94 workshop on knowledge
discovery in Data bases, pp 181-192, AAAI press, 1994.
[Mannila 1997]: H. Mannila et H. Toivonen: "Levelwise search and bordres of theories
in knowledge discovery". Data mining and knowledge discovery, 1(3),
pp 214-258, 1997.
[Medina 2009]: J. Medina, M. Ojeda-Aciego et J. Ruiz-Calvino. "Formal concept
analysis via multi adjoint concept lattices ". Fuzzy sets and systems,
160 (2), pp130 -144, 2009.
[Park 1995]: J. S. Park, M. S. Yu. "An efficient hash based algorithm for mining
association rules using closed itemset lattices". Information systems
24(1), pp 25-46,1995.
[Pasquier 2000] : N. Pasquier: "Algorithmes d’extraction et de réduction des règles
d’association dans les bases de données". Université Clermont-
Ferrand II, Ecole Doctorale, sciences pour l’ingénieur de Clermont-
Ferrand, 2000.
88
[Pollandt 1997]: S. Pollandt: " Fuzzy Begriffe". Springer-Verlag, Berlin/ Heidelberg,
1997.
[Savasere 1995]: A. Savasere, E. Omeicinsky et S. Navathe: "An efficient algorithm for
mining association rules in large databases". In proceedings of 21st
international conference on very large Data bases (VLDB’95), pp 432-
444, 1995.
[Shao 2007]: M. Shao , W. Zhang: "Set approximations in fuzzy formal concept
analysis". Fuzzy sets and systems 158(23), pp 2627-2640, 2007.
[Silvertein 1998] : C. Silvertein, S. Brin, R. Motwani, et J.D.Ullman: "Techniue for
mining causal structures. ". In proceeding of the 24th international
conference on very large Data bases (VLDB’98), 1998.
[Toivonen 1996]: H. Toivonen: "Sampling large databases for association rules". In
proceedings for the 22nd international conference on very large Data
bases (VLDB’96), pp 134-145, 1996.
[Wille 1982]: R. Wille : "Restructuring lattice theory: An approach based on
hierarchies of concepts". In Rival, Dordrecht, Boston, pp 445-470,
1982.
[Wolff 1993]: K. E. Wolff : "A first course in formal concept analysis, how to
understand line diagrams". In faulbaum, F.ed. softStat’93, advances in
statistical soft ware 4, pp 429-439, 1993.
[Yager 1980]: R. R. Yager: "An approach to inference in approximate reasoning". In
journal of Main-machine studies, vol. 19, pp195-227, 1980.
[Yao 2006]: Y. Y. Yao, Y. Chen: "Rough set approximations in formal concept
analysis". Transaction on rough sets V, LNCS 4100, pp 285–305,
2006.
[Zadeh 1965]: L. Zadeh: "Fuzzy Sets In information and control". Vol. 08, pp. 338-
352, 1965.
89
[Zadeh 1978] : L. Zadeh: "fuzzy sets as basis for a theory of possibility, fuzzy sets
and systems". pp 3-28, 1978.
[Zaki 1998]: M. J. Zaki et M. Ogihara: "Theoretical foundations of association
rules". In DMKD’98 workshop on research issues in Data mining and
knowledge discovery, 1998.
[Zhang 2007]: W. Zhang: "Variable threshold concept lattices". Information sciences
177(22), pp 4883-4892, 2007.