Download - MEMOIRE · 2020. 5. 1. · 1 République Algérienne Démocratique et Populaire Ministère de l'Enseignement Supérieur et de la Recherche Scientifique Université M'hamed Bougara

1

République Algérienne Démocratique et PopulaireMinistère de l'Enseignement Supérieur et de la Recherche Scientifique

Université M'hamed Bougara - Boumerdès

Faculté des SciencesDépartement d’Informatique

MEMOIRE

Pour l’obtention du diplôme de MAGISTER

Spécialité : Systèmes informatiques et génie des logiciels.

Option : Spécification de Logiciel et Traitement de l’Information

Thème :

Présenté par : SEDDOUD FERROUDJA.

Devant le jury :

Mr. MEZGHICHE Mohamed Pr UMBB Président

Mr. DJOUADI Yassine Pr UMMTO Promoteur

Mme. AISSANI –MOKHTARI Aicha Pr USTHB Examinatrice

Mme. KHELLAF-HANED Faiza MCA USTHB Examinatrice

Année universitaire : 2011/2012.

Construction du treillis de concepts formels pour des contextes à

intervalle de vérité à partir d’implications résiduées

2

REMERCIEMENTS

Mes vifs remerciements accompagnés de toute ma gratitude vont à mon

encadreur Monsieur DJOUADI Yassine, maître de conférence à l’UMMTO, pour

m’avoir accueillie dans son équipe de recherche, pour ces remarques et conseils

judicieux qui mon beaucoup contribué à l’amélioration de ce mémoire et surtout, pour

sa rigueur scientifique et sa disponibilité. Je le remercie également pour m’avoir initiée

à la recherche et de m’avoir fait bénéficier de ces connaissances.

Je voudrais également remercier vivement Monsieur le président du jury

MEZGHICHE Mohamed, professeur et directeur de l’école doctorale d’informatique à

l’UMBB, pour nous avoir accueilli dans son laboratoire LIFAB et nous avoir fourni

une formation riche pendant notre première année de magister.

Je tiens à remercier vivement madame AISSANI MOKHTARI Aicha, professeur

à l’USTHB qui nous a fait l’honneur d’accepter de juger ce modeste travail et y avoir

consacré son précieux temps

De la même manière, je tiens à remercier vivement madame HANED Faïza,

maître de conférences à l’USTHB qui nous a fait l’honneur d’accepter de juger ce

modeste travail et y avoir consacré son précieux temps.

Je tiens à remercier madame AMIROUCHE Fatiha, maître de conférences à

l’UMMTO qui nous a fait l’honneur d’accepter de juger ce modeste travail et y avoir

consacré son précieux temps

Enfin, que tous ceux qui nous ont aidés et encouragés, de près ou de loin,

retrouvent notre gratitude et s’incères remerciements.

3

A ma très chère maman et mon très cher Papa.A Hamou et sa famille ainsi que mon très cher fils Mehdi.

A mes frères Belaïd, Hacene et mon petit frère Yacine.

4

Liste des tables

Table II.1 Représentation du contexte formel C ............................................................5

Table II.2 Contexte d’extraction de règles d’association D ............................................18

Table II.3 Les sous-ensemble d’items fermés fréquents du D ......................................20

Table II.4 Base de Duquenne Guigues du contexte D ..................................................22

Table II.5 Base propre de Luxenburger extraite du contexte formel D ..........................23

Table II.6 Relation binaire terme /Document .................................................................24

Table II.7 Table représentant la fonction F ....................................................................26

Table III.1 Les principales normes et co-normes triangulaires.......................................35

Table III.2 Table de vérité de l’implication classique ( → ) .........................................38

Table III.3 Les principales S-implication .......................................................................39

Table III.4 Les R-implications les plus courantes...........................................................41

Table IV.1 Contexte formel flou .....................................................................................44

Table IV.2 Relation binaire floue Régions/Climat ..........................................................49

Table IV.3 Table représentant le contexte formel flou D................................................59

Table IV.4 Table représentant le contexte formel non flou pour =0.8..........................60

Table IV.5 Table représentant le contexte formel du contexte D′ ..................................60

Table IV.6 Relation binaire floue termes/documents .....................................................63

Table V.1 Table de vérité de et ( ) ......................................................71

Table V.2 Contexte formel illustrant la relation R...........................................................77

Table V.3 Liste des concepts formels de l’implication de Gödel ....................................79

Table V.4 Liste des concepts formels flous de Dienes Nilpotent ...................................79

5

Liste des figures

Figure II.1 Hiérarchie (treillis) des concepts formels......................................................6

Figure II.2 Hiérarchie des concepts formels après le rajout des deux animaux.............8

Figure II.3 Treillis des sous-ensembles d’items fermés du contexte D ..........................19

Figure II.4 Treillis des sous-ensembles d’items fermés fréquents du contexte D ..........20

Figure II.5 Deux arbres de décision représentant la fonction F .....................................26

Figure III.1 Fonction caractéristique (ensemble classique)............................................30

Figure III.2 Fonction d’appartenance (ensemble flou) ...................................................30

Figure III.3 Vue horizontale d’ensemble flou -coupe ...................................................32

Figure III.4 Vue verticale d’une -coupe .......................................................................32

6

NotationDescription des symboles utilisés dans le mémoire

Join(E) : Le plus petit majorant des éléments de E.

Meet(E): Le plus grand minorant des éléments de E.

: Relation d’ordre.

: Relation de couverture.

A\B : Différence ensembliste.∪ : Union.: Union généralisée.∩ : Intersection.: Intersection généralisée.⊆ : Inclusion.⊂ : Inclusion sans égalité.

|E| : Cardinalité de l’ensemble E.

2E : Ensemble des parties de E.

: Implication.⇔ : Equivalence.

f g(.) : Composition de fonctions.

: Complémentation

7

SOMMAIRE

Chapitre I. Introduction générale

I. Introduction...................................................................................................................1

Chapitre II. L'analyse de concepts formels (classique)II.1. Introduction...............................................................................................................4II.2. Rappels Mathématiques ...........................................................................................8II.3. Connexion de Galois ..............................................................................................11II.4. Théorie de l'analyse de concepts formels...............................................................12II.5. Généralisation des opérateurs de dérivation ..........................................................14II.6. Application de l'analyse de concepts formels .........................................................15

II.6.1. La découverte des règles d'association...........................................................15II.6.1.1. Approche orienté fréquents ....................................................................17II.6.1.2. Approche basée sur l'ACF .....................................................................19

II.6.2. La recherche d'information ..............................................................................23II.6.3. La classification ...............................................................................................25

II.7. Conclusion..............................................................................................................27

Chapitre III. Théorie des ensembles flousIII.1. Introduction..............................................................................................................29III.2. Rappels sur la théorie des ensembles flous ............................................................ 29III.3. Les opérations ensemblistes floues......................................................................... 34

III.3.1. Intersection et union d’ensembles flous.......................................................... 34III.3.2. Le Complément .............................................................................................. 36III.3.3. Le produit cartésien ........................................................................................ 36III.3. 4. Les relations floues et la composition de relations ........................................ 37III.3.5. L’égalité .......................................................................................................... 38III.3.6. L'inclusion....................................................................................................... 38

III.4. Les implications floues........................................................................................... 38III.4.1. S-implication................................................................................................... 39III.4.2. R-implication................................................................................................... 40

III.5. Conclusion............................................................................................................. 43

Chapitre IV. Analyse de concepts formels floueIV.1. Introduction ........................................................................................................... 44IV.2. Contexte formel flou et concepts formels flous...................................................... 45IV.3. Etat de l'art ............................................................................................................ 46

IV.3.1. Rappels mathématiques ................................................................................ 47

8

IV.3.2. Approches existantes.................................................................................... 48IV.3.2.1. Approche de Burusco et al. ................................................................ 48IV.3.2.2. Approche de Pollandt et Belohlavek ................................................... 52IV.3.2.3. Approche de Georgescu et Popescu .................................................. 55IV.3.2.4. Approche dite "One sided fuzzy formal context " ................................ 56IV.3.2.5. Approche basée sur les -coupes ...................................................... 59

IV.4. Généralisation des opérateurs de dérivation de Galois au cas flou ...................... 61IV.5. Application de l’ACF floue en RI............................................................................ 62IV.6. Problématique ....................................................................................................... 64IV.7. Conclusion ............................................................................................................ 65

Chapitre V. ContributionV.1. Introduction ............................................................................................................ 66V.2. Proposition d’une algèbre minimale ....................................................................... 66V.3. Génération des concepts formels flous .................................................................. 72

V.3.1. Finitude ........................................................................................................... 72V.3.2. Présentation de l’algorithme............................................................................ 75

V.4. Conclusion ............................................................................................................. 79

Chapitre VI. Conclusion & Perspectives

VI.1. Conclusion ............................................................................................................ 80VI.2. Perspectives.......................................................................................................... 80Annexes......................................................................................................................... 82Bibliographie.................................................................................................................. 84

9

RESUME

Classiquement l’analyse de concepts formels est basée sur des relations binaires et

Booléennes entre un ensemble d’objets et un ensemble de propriétés (appelé contexte formel).

Généralement ces relations sont complètement renseignées. Il s’avère que dans la réalité

certaines relations entre objets et propriétés peuvent être partiellement connues, incertaines,

imprécises, vagues, floues ou carrément inconnues. De ce fait, l’ACF est amenée à considérer

des relations de diverses natures, modélisant des réalités concrètes (e.g. mesures,

observations, jugements,…etc.) Plusieurs approches proposent d’étendre l’ACF à l’ACF

floue. Actuellement, la tendance générale de l’ACF consiste à utiliser une algèbre résiduée

pour maintenir les propriétés de fermeture.

Notre première contribution consistera à trouver une algèbre minimale (plus

faible que la résiduation). Une telle algèbre délivre un ensemble d’implications floues

plus général (plus grand) que l’ensemble des implications résiduées.

L’ensemble des concepts formels flous (treillis de concepts formels) obtenu à

partir d’une implication residuée est généralement infini. Aussi, il n’existe pas

d’approche dans la littérature proposant la construction intégrale de ce treillis (car il

est infini). Notre deuxième contribution consistera à : Mettre en évidence quelques

implications floues qui engendrent un ensemble fini de concepts formels

Mots clés : Analyse de concepts formels, Contextes flous, treillis algébriques flous,

R-implication.

10

Abstract

Basically, formal concept analysis is concerned with binary Boolean relations

(called formal contexts) between a set of objects and a set of properties. Generally this

relation is completely defined. In the reality some relations are partially defined,

uncertain, imprecise, and fuzzy or bluntly unknown. Consequence So, FCA considered

various natures of relations that specify concretes reality (e.g. measures, observations,

judgments). Several proposals for extending formal concept analysis to fuzzy FCA.

Currently, a general tendency of FCA consists of using a residuation algebra for

minting the closure property and Galois connection property.

Our first contribution consists of finding a minimal algebra. This algebra release

a fuzzy implication set is more general that a residuated implications set.

A fuzzy formal concepts set (formal concepts lattice) obtain from a residuated

implication is generally infinite. In the literature it not exist proposals that proposed

the integral contraction of the lattice (because it is infinite). Our second contribution

consist of plainly visible some fuzzy implications that engender a finite set of formal

concepts

Keywords: Formal concept analysis, Fuzzy context, Fuzzy lattice, R-implication.

11

الملخصبین Booléenneعلاقة ثنائیة و علىمبني ″Analyse de concepts formels″كلاسیكیا، التحلیل لفكرة قطعیة َ

.contexte formel″″مجموعة مواضیع و مجموعة خواص، ھذه العلاقة تدعى بالنص الصریح

معرفة جزئیا، غیر أكیدة، غیر دقیقة، غامضة أو غیر معرفة : مـن المؤكـد أن ھناك علاقات بین المـواد و الخـواص تكونموجھة للأخـــذ بعیـن الاعتبار العـلاقــات المختلفـة التي ″ACF″فكــرة قطعیة مـن ھــذا المنطلق، التحلیل ل. بالكـامل

إلخ...قیاسـات، ملاحظات، أحكام (تجسد حقـائق ملموسـة

Analyse de ″إلى التحلیل الغامض لفكرة قطعیـة ″ACF″الكثیر من المذاھب تقترح توسیع التحلیل لفكرة قطعیة concepts formels floue une algèbre″حالیا ھناك نزعة عامة لاستعمال [1,0].نتـمي إلــى المجــال ت″

résiduée″للحفاظ على خواص الإغلاق

و التـي تحافظ على خواص الإغلاق و ″une algèbre non résiduée″بحثنــا یكمـن فـي إیجـاد و تعریف″Galois″خواص صلة

ر-التحلیل لفكرة قطعیة، النص الصریح،النص الغامض، الإنشاء التشاكلي الغامض، علاقة الإستلزام : المفاتیحكلمات

Chapitre I Introduction générale

1

Introductiona théorie de l’analyse de concepts formels (abrév. ACF) a été introduite par

Wille en 1982 [Wille 1982]. Cette théorie permet d’induire des structures

hiérarchiques de concepts formels à partir de structures (représentations)

relationnelles. Elle a été utilisée dans divers domaines: psychologie, sociologie,

médecine, biologie, linguistique, informatique, etc. [Wolff 1993].

L’analyse de concepts formels consiste à découvrir des clusters de connaissance

à partir de relations binaires. Généralement, ces relations sont représentées sous forme

de tables avec en ligne des objets et en colonne des propriétés. Etant donné une

relation R, l’intersection d’une ligne et d’une colonne (i.e. cellule) indique si un objet"x" vérifie ou ne vérifie pas la propriété "a". Classiquement, les relations considérées

sont non seulement binaires et booléennes mais aussi complètement renseignées (c.à.d.

il est toujours connu si un objet possède ou ne possède pas une propriété).

Il s’avère que dans la réalité, certaines relations entre objets et propriétés peuvent

être partiellement connues, incertaines, imprécises, vagues, floues ou carrément

inconnues. De ce fait, l’ACF est amenée à considérer des relations de diverses natures,

modélisant des réalités concrètes (e.g. mesures, observations, jugements, etc.) où

peuvent apparaître des questions de gradualité et/ou d’incertitude. A titre d’exemple,

dans le domaine de l’enseignement il est parfois difficile d’évaluer le niveau de

maitrise de la langue Anglaise pour un élève donné. L’enseignant peut estimer un tel

niveau par une valeur numérique comprise entre 0 et 1 et donc, il peut dire qu’un tel

élève maitrise l’Anglais à 80%.

La présence de ces valeurs imprécises et floues, a suscité de nombreuses

recherches dans le cadre de l’analyse de concepts formels floue notamment en ce qui

concerne la généralisation des opérateurs de fermeture concernant des relations floues

et le problème sous-jacent de la génération des concepts formels flous.

Toutes les approches existantes [Pollandt 1997], [Belohlavek 1998], [Latiri

2003], [Georgesco 2004], [Ben Yahia 2007], [Medina 2009] utilisent une implication

L


2

résiduée c.à.d. telle que ( ≤ ⇔ ∗ ≤ ). Le fait d’utiliser une implication

résiduée restreint considérablement le nombre d’implications éligibles pour l’ACF

floue.

Notre première contribution consistera alors à prouver une algèbre minimale

(plus faible que la résiduation). Une telle algèbre délivre un ensemble d’implications

floues plus général (plus grand) que l’ensemble des implications résiduées.



d’approche dans la littérature proposant la construction intégrale de ce treillis (car il

est infini).

Notre deuxième contribution consistera à Mettre en évidence quelques

implications floues qui engendrent un ensemble fini de concepts formels et Proposer

les algorithmes permettant de déterminer de manière effective et efficace l’ensemble

des concepts formels.

Pour ce faire ce mémoire s’articule autour de cinq chapitres :

Le premier chapitre : concerne une introduction générale.

Le second chapitre : porte sur l’analyse de concepts formels (cas classique). Dans

ce chapitre nous commençons par une représentation intuitive de [Wille 1982], nous

donnons par la suite une représentation basée sur des fondements mathématiques ainsi

que des notions de fermeture de connexion de Galois. Comme nous avons abordé à la

fin de cette section quelques applications de l’analyse de concepts formels

Le troisième chapitre : présente en détail la théorie des ensembles flous ainsi que

les différents opérateurs algébriques et essentiellement les implications floues

(notamment les R-implications).

Le quatrième chapitre : porte sur l’analyse de concepts formels floue. Dans cette

partie nous donnons les notions de base d’une ACF floue et par la suite, nous

présentons les différentes approches qui existent. Nous terminons cette partie par les

applications de l’ACF floue, en se limitant au domaine de la recherche d’information.


3

Le dernier chapitre: est réservé à notre contribution. Dans ce chapitre nous

présentons deux contributions. La première contribution portera sur un aspect

méthodologique, elle consistera à prouver une algèbre minimale ainsi nous renforçons

les fondements théoriques de l’ACF floue en élargissant les algèbres actuellement

utilisées. La deuxième contribution portera sur un aspect opérationnel et constructif

qui exhibe deux implications : la première est l’implication de Gödel et la deuxième

est l’implication de Dienes Nilpotent. Nous terminons par la présentation des

algorithmes de ces implications.

Enfin nous concluons et présentons des perspectives futures à ce travail.

Chapitre II Analyse de concepts formels

4

II.1. IntroductionL’analyse de concepts formels a été introduite par Wille en 1982 [Wille 1982].

L’ACF permet d’induire des clusters de connaissances et se présente comme une

méthode d’apprentissage et de représentation de connaissances. Elle a été utilisée dans

divers domaines : psychologie, sociologie, biologie, médecine, linguistique,

mathématiques, informatique, etc.

Nous commençons notre étude par une présentation intuitive de l’ACF sans pour

autant introduire de formalisme mathématique. Nous consacrerons par la suite une

section complète pour la présentation théorique de l’ACF sur la base de fondements

mathématiques (algébriques).

Pour bien fixer les idées nous devons connaitre c’est quoi un concept formel ?

D’un point de vue psychologique, un concept formel est une unité de pensée constituée

de deux parties, la partie "extension" et la partie "intension". La partie

extension recouvre tous les objets du concept formel et la partie intension comprend

toutes les propriétés possédées par tous ces objets. En effet les objets et les propriétés

jouent un rôle proéminent ensemble avec les différentes relations comme: la hiérarchie

entre les concepts (sur-concept, sous-concept) la relation d’implication entres

propriétés et la relation d’incidence entre les paires (objet/ propriété) (un objet possède

une propriété).

L’idée de Wille était d’illustrer dans un premier temps les paires (objet/

propriété) ainsi que la relation d’incidence selon une représentation mathématique

appelé contexte formel, ce dernier est considéré comme un outil de description des

situations élémentaires sous la forme: l’objet "x" possède la propriété "a". Dans un

deuxième temps, il s’agira de découvrir les ensembles maximaux des objets

satisfaisant un certain ensemble de propriétés.


5

ExempleSoit un ensemble d’animaux {lion, rouge-gorge, aigle, lièvre, autruche} décrit

par rapport à certaines de leurs propriétés {prédateur, vole, ovipare, mammifère}. Le

contexte formel noté C (autrement dit la relation binaire) est représenté sous forme

d’une table avec en lignes les animaux (correspondant aux objets) et en colonnes les

propriétés, telle que si l’objet "xi" vérifie (resp. ne vérifie pas) la propriété "aj" alors la

cellule "cij" est marquée par une croix (resp. reste vide).

Attribut

Animal

prédateur vole ovipare mammifère

lion × ×rouge-gorge × ×aigle × × ×autruche ×lièvre ×

Table II.1: Représentation du contexte formel C

Pour expliquer la notion de concept formel, nous considérons toutes les

propriétés du rouge-gorge {vole, ovipare} et posons-nous la question: quels sont les

animaux satisfaisant ces propriétés? Nous obtenons alors l’ensemble X = {aigle, rouge-

gorge}. Nous constatons que l’ensemble X est l’ensemble maximal des animaux

satisfaisant toutes les propriétés de l’ensemble A = {vole, ovipare}.

Il résulte que X est l’ensemble de tous les animaux vérifiant toutes les propriétés

de A et A est l’ensemble de toutes les propriétés vérifiées par tous les animaux de X. La

paire ⟨ , ⟩est appelé concept formel. Tandis que X est appelé extension et A est

appelé intension.

Hiérarchie entre concepts formels

Entre les concepts formels, il y a une relation d’ordre partiel c.à.d. la relation"Sous-concept, Sur-concept".


6

Etant donné deux concepts formels ⟨ , ⟩, et ⟨ , ⟩. On dit que ⟨ , ⟩ est un

sous-concept de ⟨ , ⟩, (dualement ⟨ , ⟩ est un sur-concept de ⟨ , ⟩) si l’extension

de ⟨ , ⟩ est un sous ensemble de l’extension de ⟨ , ⟩. c.à.d. ⊆ (dualement:

l’intension de ⟨ , ⟩ est un sur-ensemble de l’intension de ⟨ , ⟩. c.à.d. A ⊇ ).

Reprenons l’exemple précédent. Etant donné les deux concepts formels suivants:⟨{aigle}, {prédateur, vole, ovipare}⟩ et ⟨{aigle, rouge-gorge}, {vole, ovipare}⟩.⟨{aigle}, {prédateur, vole, ovipare}⟩ est un sous-concept de ⟨{aigle, rouge-gorge},

{vole, ovipare}⟩ . Dualement, ⟨{aigle, rouge-gorge}, {vole, ovipare}⟩ est un sur-

concept de ⟨{aigle}, {prédateur, vole, ovipare} ⟩. L’extension {Aigle} du sous-concept

est un sous-ensemble de l’extension {aigle, rouge-gorge} du sur-concept. De la même

manière l’intension {prédateur, vole, ovipare} du sous-concept est un sur-ensemble de

l’intension {vole, ovipare} du sur-concept. Dans la Figure II.1, nous représentons la

hiérarchie de tous les concepts formels du contexte représenté dans la Table II.1. Il est

à noter que le type de représentation utilisé dans la Figure II.1 est une représentation

condensée. La règle suivante permet de lire tous les concepts formels.

Figure II.1 : Hiérarchie (treillis) des concepts formels

ovipareautruche

mammifèrelièvre prédateur

volerouge-gorge

aiglelion


7

Comment lire la Figure II.1

Cette Figure est constituée de nœuds et de segments. Elle comporte aussi les

noms de tous les objets et toutes les propriétés du contexte. Chaque nœud correspond à

un concept formel. La Figure peut être lue comme suit: A chaque fois qu’un nœud "n"

est étiqueté par une propriété "a", tous les objets descendants de ce nœud "n" héritent

la propriété "a". De façons duale, à chaque fois qu’un nœud "n" est étiqueté par un

objet "x", "x" est hérité vers le haut et tous les ancêtres de nœud "n" le partage. Ainsi

l’extension "X" d’un concept ⟨ , ⟩ correspondant au nœud "n" est obtenue en

considérant tous les objets qui apparaissent sur les descendants du nœud "n" dans le

treillis et son intension est obtenue en considérant toutes les propriétés qui

apparaissent sur les ancêtres du nœud "n" dans le treillis.

Nous pouvons remarquer que dans cet exemple, l’intension du concept formel

sommet correspond à l’ensemble vide, tandis que l’extension de concept formel

sommet correspond à l’ensemble de tous les animaux. Nous pouvons trouver toute fois

un concept formel sommet différent de l’ensemble vide.

Relation d’implication entre les propriétés

L’interprétation de la Figure II.1 nous renseigne aussi sur diverses relations

d’implication entre propriétés. On dit que a→b, si " " un descendant de la

propriété " " or vole est descendant de ovipare alors vole → ovipare. Considérons les

implications entre propriétés déduites du contexte C suivantes:

1-vole → ovipare,

2-mammifère et vole → prédateur et ovipare,

Considérons l’univers des objets U. Nous constatons rapidement que les deux

implications (1 et 2) sont vérifiées dans C, mais elles ne sont pas vérifiées dans U.

nous citons deux contres exemples respectivement :

Une abeille vole mais elle n’est pas ovipare, une chauve-souris est mammifère et elle

vole mais elle n’est ni prédateur, ni ovipare. Alors la Figure II.1 devient :


8

Figure II.2 : Hiérarchie de concepts formels après rajout

des animaux abeille et chauve-souris

II.2. Rappels MathématiquesDans cette section, nous rappelons quelques définitions nécessaires à notre

travail. Ces définitions concernent les ensembles ordonnés, les treillis, les treillis

complets et les opérateurs de fermeture. Ces définitions sont extraites de [Pasquier

2000].

Définition 1(Ensemble ordonné)

Soit E un ensemble, un ordre ou un ordre partiel sur l’ensemble E est une relation

binaire ≤, sur les éléments de E tel que pour tout a, b, c E nous avons les propriétés

suivantes :

1. Réflexivité : a ≤ a,

mammifèrelièvre

ovipareautruche

voleprédateur

rouge-gorge

aiglelionchauve-souris

abeille


9

2. Antisymétrie : a ≤ b et b ≤ a a = b,

3. Transitivité : a ≤ b et b ≤ c a ≤ c.

Un ensemble E doté d’une relation binaire d’ordre≤, noté (E,≤ ), est appelé

ensemble ordonné.

Définition 2 (Ouvert)

Un ouvert est un sous ensemble d’un espace topologique qui ne contient aucun

point de sa frontière.

Exemple

Considérons l’ensemble des nombres réels R, l’intervalle ]0, 1[ est un ouvert. En

revanche, l’intervalle ]0, 1] n’est pas un ouvert, car l’élément "1" appartient à

l’intervalle ]0, 1].

Définition 3 (Topologie)

Une topologie dans U est une famille de sous-ensembles de U fermée par

rapport à une union arbitraire et une intersection finie et contenant l’ensemble ∅ et U.

Le couple ( , ) est nommé "espace topologique", les éléments de U appelés "les

points ", les éléments de appelés "ensembles ouverts ", Le complémentaire d’un

ensemble ouvert est un "ensemble fermé". Etant donné X ⊆ U l’intérieur I(X) de X est

le plus grand ensemble ouvert contenu dans X.

La famille B⊆ est la base de topologie si chaque ensemble ouvert est un sous

ensemble de B. il est bien clair que la famille des ensembles B est la base de certaines

topologies de U si et seulement si U = B et pour chaque X, Y ⊂ B. Etant donné

x ∈ (X∩Y), il existe Z ⊂ B tel que x ∈ Z⊆ (X∩Y).


10

Définition 4 (Operateurs de fermeture)

Soit un ensemble partiellement ordonné (E, ≤). Une application de (E, ≤)dans

(E, ≤) est un opérateur de fermeture si et seulement si elle possède les trois propriétés

suivantes pour tout élément a, b ∈ E :

1. Isotonie : a ≤ b (a) ≤ (b)

2. Extensivité: a ≤ (b)

3. Idempotence : ( (a)) = (a).

Etant donné un opérateur de fermeture sur un ensemble partiellement ordonné

(E, ≤), un élément ∈ est un élement fermé si l’image de par l’opérateur de

fermeture est égale à : ( ) = .Définition 5 (Relation de couverture)

Soit (E, ≤) un ensemble ordonné et , b, deux éléments de E. la relation de

couverture entre les éléments de E, notée , est définie par: si et seulement si≤ et il n’existe pas un élément E tel que ≤ ≤ avec ≠ et ≠ .

signifie que: couvre ou bien que est un successeur immédiat de .

Définition 6 (Opérateurs Join et Meet)

Soit un sous ensemble A E de l’ensemble ordonné (E, ≤). Un élément u E

est un majorant, ou upper- bound, de A si pour tout élément A nous avons ≤ u.

L’ensemble des majorants de A est noté UB(A). Dualement, un élément vE est un

minorant, ou lower-bound, de A si pour tout élément A nous avons v ≤ .

L’ensemble des minorants de A est noté LB(A).

UB(A) = {u A | A , ≤ u}

LB(A) = {v A | A , v ≤ }


11

Le plus petit majorant d’un ensemble A, s’il existe, est le plus petit élément de

l’ensemble UB(A) des majorants de A. Cet élément est noté Join(A). dualement, le plus

grand des minorants d’un ensemble A, s’il existe, est le plus grand élément de

l’ensemble LB(A) des minorants de A. cet élément est noté Meet (A).

Join(A) = Min ∈ (UB(A)) = ∈ UB(A)

Meet(A) = Max ∈ (LB(A)) = UB∈ (A)

Définition 7 (Treillis complet)

Un ensemble ordonné (E, ≤) non vide est un treillis si pour tout couple d’élément

( , ) E l’ensemble {x, a} possède un plus petit majorant noté Join ({x, a}) et un plus

grand minorant noté Meet({x, a}). L’ensemble ordonné (E, ≤) est un treillis complet si

pour tout sous ensemble S ⊆ E les éléments Join(S) et Meet(S) existent. Les treillis

sont fréquemment représentés sous forme de diagrammes de Hasse, également appelé

graphes de couverture, dont les sommets sont les éléments de l’ensemble et les arcs

correspondent aux relations de couverture entre les sommets.

II.3. Connexion de Galois

Soit une relation binaire (notée R) complètement définie entre un ensemble

d’objet O et un ensemble de propriétés P . Soit l’application de l’ensemble des

parties de O dans l’ensemble des parties de P ( : 2O→2P) et soit l’application ψ de

l’ensemble des parties de P dans l’ensemble des parties de O ( : 2P →2O). Nous

donnons ci après la définition d’une connexion de Galois.

Définition 8 (Connexion de Galois)

La paire d’opérateur ( , ) est une connexion de Galois si la propriété suivante

est vérifiée ∀ ⊆ O, ⊆ P :⊆ ( ) et ⊆ ( )


12

Un cas particulier de connexion de Galois est obtenu en définissant les fonctionset de la manière suivante. La fonction associe à un ensemble d’objets ⊆ O

l’ensemble ( ) des propriétés ∈ P communes à tous les objets x ∈ .(X) = { ∈ P | ∀ ∈ : R }.

La fonction associe à tout ensemble ⊆ P l’ensemble ( ) des objets x ∈ O

contenant toutes les propriétés ∈ .

( ) ={ ∈O / ∀ ∈ : R }.

Il est aisé de remarquer que le couple d’application ( , ) est une connexion de Galois

entre l’ensemble des parties de O et l’ensemble des parties de P. Les propriétés

suivantes sont vérifiées quelque soient les ensembles : , , ⊆P et X, Y, Z ⊆ O.

1. ⊆ ( ) ⊇ ( ) 1`. ⊆ (X) ⊇ (Y)

2. X ⊆ ( ) ⇔ ⊆ ( )II.4. Théorie de l’analyse de concepts formels

L’ACF fournit un cadre théorique pour l’apprentissage de la hiérarchie de

concepts formels. Cet apprentissage s’effectue à partir d’un contexte formel K = (O,

P, R) où R est une relation binaire complètement définie entre un ensemble d’objets

O et un ensemble de propriétés P. Généralement la relation R est représentée sous

forme d’une table avec en lignes des objets et en colonnes des propriétés telle que : la

présence d’une croix (×) (resp. l’absence) dans la cellule cij indique que l’objet x

satisfait (resp. ne satisfait pas) la propriété . Soulignons qu’une croix peut être aussi

représentée par la valeur 1. Soulignons aussi que dans la suite de ce mémoire nous

utiliserons indifféremment les termes propriétés et attributs pour désigner les éléments

de l’ensemble P.


13

Etant donné un objet x et une propriété , soit R (x) ={ ∈P | xR }

l’ensemble des propriétés satisfaites par l’objet x (xR signifie que x possède la

propriété ) et soit R ( ) ={x ∈O | xR } l’ensemble

des objets possédant la propriété . On définit en ACF des correspondances entre les

ensembles 2O et 2P. Ces correspondances sont appelés opérateurs de dérivation de

Galois. Dans son papier précurseur sur l’analyse de concepts formels, Wille propose

l’utilisation d’un opérateur de dérivation de Galois de manière duale. Cet opérateur est

différemment noté dans la littérature par : (. )∗, (. )↑, (. )↓. Dans notre mémoire, nous

appellerons l’opérateur classique de Wille: opérateur de suffisance et nous le noterons(. )∆. Nous donnons ci-après sa définition.

Etant donné X ⊆O et ⊆P, l’opérateur de suffisance (noté(. )∆) permet :

- d’exprimer l’ensemble des propriétés satisfaites par tous les objets de X comme :∆ = { ∈ P |∀ x ∈O (x ∈ X→xR )}

={ ∈ P | XR ( )}

= ∈ R ( x)

- d’exprimer dualement l’ensemble des objets satisfaisant toutes les propriétés de

comme : ∆ = {x ∈O | ∀ ∈P (a ∈ →xR )}

={x ∈O | R ( x)}

= ∈ R ( )

La paire duale d’opérateurs ⟨(. )∆, (. )∆⟩ constitue ainsi une connexion de Galois qui

permet d’induire des concepts formels. Un concept formel est une paire ⟨ , ⟩ telle

que ∆ = et ∆ = X. Autrement dit, X est l’ensemble maximal d’objets satisfaisant

toutes les propriétés déjà satisfaites par tous les objets de X. Rappelons que l’ensemble

X (resp. ) est appelé extension (resp. intension) du concept.


14

Soit B l’ensemble des concepts formels d’un contexte K= (O, P, R). Cet

ensemble est muni d’une relation d’ordre partiel définie comme suit :⟨ , ⟩ ⟨ , ⟩ ssi X Y (ou ).

Nous appelons alors ⟨ , ⟩ un sous-concept de ⟨ , ⟩ et ⟨ , ⟩ est un sur-concept de⟨ , ⟩. Dans Ganter et Wille, il a été démontré que l’ensemble B des concepts formels

muni de la relation d’ordre définie ci-dessus forme un treillis complet noté B(K).

Le Théorème Fondamental de Ganter et Wille [Ganter 1999] donne le Meet et le Join

pour chaque sous ensemble de concepts formels comme suit :

⟨ , ⟩∈ = ∈ , ∈∆ ∆

⟨ , ⟩∈ = ∈∆ ∆ , ∈

II.5. Généralisation des opérateurs de dérivationD’autres opérateurs de dérivation de Galois ont été mis en évidence dans le cadre

de l’analyse qualitative de données [Düntsch 2003]. Dans [Dubois 2009] Dubois et Prade

ont mis en évidence, dans le cadre de la théorie des possibilités de [Zadeh 1978], trois

nouveaux opérateurs de dérivation, à savoir l’opérateur de possibilité (noté (. ) ) ,

l’opérateur de nécessité (noté (. ) ) ainsi que l’opérateur (. )∇ dual de l’opérateur de

suffisance (. )∆ vu précédemment. Ces opérateurs sont définis sur les ensembles 2O et

2P comme suit :

Définition 9 (Opérateur de possibilité )

est l’ensemble de propriétés satisfaites par au moins un objet dans X


15

= { ∈ P |X∩R ( ) ≠ ∅}

= { ∈ P |∃ ∈O, xR }

Définition 10 (Opérateur de nécessité N)

est l’ensemble des propriétés que seuls les objets de X ont

= { ∈ P |R( )⊆ }

= { ∈ P |∀ ∈O (xR ) → ∈ }

Définition 11 (Opérateur de suffisance dual )∇ est l’ensemble des propriétés non satisfaites par aucun objet de∇= { ∈P |X ∪R ( ) ≠X}

= { ∈P |∃ ∈ , x }

Les opérateurs , et ∇sont définis de manière duale. Il est à noter que les paires⟨ , ⟩ telles que = et =X caractérisent des sous-contextes formels indépendants

(i.e : qui n’ont en commun ni objets ni propriétés) à l’intérieur du contexte formel

initial [Djouadi 2010].

II.6. Application de l’Analyse de concepts formelsL’analyse de concepts formels donne lieu actuellement à diverses applications

notamment dans l’aide à la décision, la découverte de connaissances, la recherche

d’informations [Latiri. 2003], etc.

II.6.1. Découverte des règles d’association

L’extraction des règles d’association a pour but d’identifier des associations

significatives entre les données. Les relations ainsi identifiées peuvent être utiles pour

de nombreux organismes commerciaux, scientifiques, industriels et de gestion de


16

l’information, afin d’améliorer leurs objectifs dans leurs activités. Par exemple, il est

important pour toute entreprise commerciale de recueillir des informations variées sur

le comportement de ses clients (préférences, habitudes) afin de mener diverses

analyses et d’en déduire des modalités d’actions. A ce titre, l’analyse des factures

(tickets de caisse) d’un supermarché permettra d’étudier les habitudes des clients

(citons par exemple : les clients qui achètent du lait ont tendance à acheter aussi du

café et du sucre.), en fonction de quoi il sera possible de réorganiser les rayons du

magasin afin d’améliorer les ventes.

L’exemple le plus populaire est celui du ‘panier de la ménagère’ qui consiste à

enregistrer l’ensemble des articles présents dans le panier d’un consommateur. Dans

cet exemple, chaque client est un objet et les articles achetés sont ses attributs, c’est

pour quoi on parle très souvent d’item pour désigner un attribut. Pour cela nous

utiliserons dans la suite de cette sous-section indifféremment les termes items et

attributs pour désigner les propriétés. Les premiers algorithmes ont fonctionné sur de

tels exemples afin de découvrir les associations cachées entre les articles achetés

ensemble. En extrayant des regroupements des articles achetés par une même

personne, nous pouvons prendre plusieurs décisions.

Généralement ; une règle d’association entre un sous-ensemble d’items

(attributs) et un sous-ensemble d’items (attributs) est notée : . Un processus

de découverte des règles d’association consiste à extraire toutes les règles

d’association telles que : support( )≥min-suport et confiance (A ) ≥ min-

confiance où support et confiance sont définis comme suit :

Support( ) =| ∆|| |

support ( ) =|( ∪ ) ∆|| | =

| ∆∩ ∆|| |confiance( ) =

( )( )


17

min-support et min-confiance sont des paramètres fixés à priori. D’autre part, un sous-

ensemble d’items est dit fréquent si support ( ) ≥min-support. A ce titre, la

première approche proposée [Agrawal 1994] pour la découverte des règles

d’association a consisté à découvrir les ensembles d’items fréquents. Cette approche

dite orientée fréquents est présentée dans la sous section suivante tandis qu’une autre

approche basée sur l’ACF sera présentée dans la sous section consécutive.

II.6.1.1. Approche orientée fréquents

Cette approche consiste à effectuer de multiples balayages du contexte (c.à.d.

parcourir le contexte formel intégralement). Ces balayages sont nécessaires afin

d’évaluer les supports des ensembles d’items qui permettront de déterminer lesquels

sont fréquents et de définir la confiance des règles d’association. De ce fait, cette phase

est considérée comme la plus coûteuse en temps d’exécution d’un processus

d’extraction de règles d’association.

La génération des règles d’association est réalisée à partir de l’ensemble des

sous-ensembles d’items fréquents. Une règle d’association B est dite valide si sa

confiance est supérieure ou égale au seuil minimal de confiance min-confiance

[Pasquier 2000].

Les approches d’extraction de règles d’association basées sur les fréquents sont

confrontées à deux problèmes majeurs. Le problème de déterminer les sous-ensembles

d’items fréquents c.à.d. les sous-ensembles d’items dont le support est supérieur ou

égal à min-support. Ce problème a une complexité exponentielle. Il est donc nécessaire

de développer des méthodes efficaces d’exploration de cet espace de recherche

[Gunopulos 1997] [Mannila 1997] [Zaki 1998]. Un autre problème lié au problème

précédent réside dans la taille des sous-ensembles des items fréquents car pour un

ensemble d’items P, le nombre de règles d’association non triviales qui peuvent être

générées pour un item fréquent est important. Soulignons toutefois que le temps de

calcul pour la génération des règles d’association à partir des sous-ensembles d’items

fréquents est faible par rapport au temps nécessaire à la découverte des sous-ensembles


18

d’items fréquents. Le problème de la réduction du temps de réponse de l’extraction des

règles d’association se réduit donc au problème de l’optimisation de la découverte des

sous-ensembles d’items fréquents. Un algorithme relativement efficace de génération

des règles d’association a été proposé par Agrawal et al dans [Agrawal 1994]. Cet

algorithme donne des temps de réponse acceptables dans la majorité des cas.

Le nombre de règles d’association générées varie en général de plusieurs dizaines

de milliers à plusieurs millions pour des grandes bases de données. Ce nombre

important de règles d’association extraits constitues un problème majeur pour la

pertinence et l’utilité du résultat. Ce problème est accentué par la présence de

nombreuses règles redondantes (définies ci-après) du point de vue de l’information

convoyée.

Règles d’association redondantes

Soit AR l’ensemble de règles d’association, une règle d’association r est dite

redondante si la règle r ainsi que sa confiance peuvent être déduits de l’ensemble AR\r.

Exemple

Soit le contexte formel D illustré dans la Table II.2. Considérons les seuils suivants :

min-support =2/6 et min-confiance = 1/2.

Table II.2: Contexte d’extraction de règles d’association D

Objet Items

1

2

3

4

5

6

a c d

b c e

a b c e

b e

a b c e

b c e


19

Si nous considérons les règles suivantes : a bce, a be, a ce, a b, a e. Nous

pouvons remarquer que ces règles possèdent la même partie gauche (a), le même

support (2/6) et la même confiance (2/3). Nous remarquons clairement que les quatre

dernières règles sont redondantes vis-à-vis de la première règle a→bce.

A cette fin, la recherche des ensembles d’items fermés au sens de l’analyse de

concepts formels apporte une amélioration concrète au problème de découverte de

règles d’association. Nous présentons ci après cette méthode.

II.6.1.2. Approche basée sur l’ACF

Dans [Pasquier 2000], l’auteur propose une approche originale pour l’extraction

de règles d’association. Cette approche basée sur l’analyse de concepts formels et les

opérateurs de dérivation de Galois permet d’une part de réduire de manière indéniable

la complexité du processus, et d’autre part de générer seulement les règles

d’association non redondantes. Plusieurs autres auteurs ([Zaki 1998], [Ben yahia

2007]), confirment d’ailleurs l’intérêt d’utiliser la connexion de Galois et la notion de

fermés. Rappelons qu’un sous ensemble ⊆ P est dit fermé si ∆∆= . Il est dit fermé

fréquent si il est fermé et si support ( ) ≥ min-support.

Exemple: Le treillis des ensembles d’items fermés associé au contexte D est

représenté dans la Figure II.3

Figure II.3 : Treillis des sous-ensembles d’items fermés associé au contexte D

{abcde}

{acd} {abce}

{ac} {bce}

{c} {be}

∅


20

L’ensemble des sous-ensembles d’items fermés fréquents dans le contexte D pour un

seuil minimal de support de 2/6 est représenté dans la Table II.3. L’itemset {bce} est

un itemset fermé fréquent pour min-support = 2/6 car support ({bce}) =(|{2, 3, 5, 6}| )/|O| =4/6, 4/6 ≥ min-support

Ensemble d’items fermés fréquents Support

{c}

{be}

{ac}

{bce}

{abce}

3/6

5/6

5/6

4/6

2/6

Table II.3 : Les sous-ensembles d’items fermés fréquents extraits

du contexte D pour min-support = 2/6

Le treillis des ensembles d’items fermés fréquents associé au contexte D est représenté

dans Figure suivante :

Figure II.4 : Treillis des sous-ensembles d’items fermés fréquents associé au contexte

D

Dans la suite nous distinguons deux types de règles d’associations : les règles

d’association exactes et les règles d’association approximatives.

{abce}

{ac} {bce}

{c} {be}

∅


21

La base de Duquenne Guigues pour des règles d’association exactes

La base de Duquenne Guigues est définie en utilisant les sous-ensembles pseudo

fermés d’attributs du contexte selon la fermeture de connexion de Galois. Nous

définissons d’abord c’est quoi une règle d’association exacte et un sous-ensemble

d’attributs pseudo fermé.

Définition 12 (Règle d’association exacte)

Une règle d’association exacte est de la forme ( \ ) tel que sa confiance

est égale à 1 et , sont deux sous-ensembles d’items fréquents tels que ⊂ et

support ( )= support ( ).

Définition 13 (Ensemble d’items pseudo-fermés fréquents)

Soit F l’ensemble des sous-ensembles d’items fréquents. Un sous-ensemble

d’item ∈ est un pseudo fermé fréquent si il n’est pas fermé (( )∆∆ ≠ ) et si il

contient les fermetures de tous ses sous-ensemble qui sont des sous-ensembles d’items

pseudo fermés fréquents. L’ensemble PF des sous-ensembles d’items pseudo fermés

est défini par :

PF= { ∈ tel que : ( )∆∆ ≠ et ∀ ⊂ , ∈ PF nous avons ( )∆∆ ⊂ }

Définition 14 (Base de Duquenne Guigues)

Soit l’ensemble PF des sous-ensembles d’items pseudo fermés fréquents d’un

contexte formel. La base de Duquenne Guigues pour les règles d’association exactes

est

BDG={r : ( )∆∆\ tel que ∈ et ≠ }

Exemple

Les sous-ensembles d’items fréquents extraits du contexte formel D est :

{ , , , , , , , , , , , , , , }, l’ensemble des sous-

ensemble d’items pseudo fermés fréquents est présenté dans la Table II.3


22

Sous-ensemble pseudo fermé fréquent Fermeture Règle exacte Support

{ }

{ }

{ }

{ }

{be}

{ }

3/6

5/6

5/6

Table II.4 : Base de Duquenne Guigues extraite du contexte formel D

pour un min-support=2/6

La base de Luxenburger pour les règles d’association approximatives

Nous définissons d’abord c’est quoi une règle d’association approximative

Définition 15 (Règle d’association approximative)

Une règle d’association approximative est de la forme ( \ ) tel que sa

confiance est strictement inférieure à 1.

Définition 16 (Base propre de Luxenburger )

Une base propre de Luxenburger pour des règles d’association approximatives

est constituée de toutes les règles de la forme ( \ ) dont l’antécédent et la

séquence sont des fermés fréquents et ⊂ . Soit FF l’ensemble des sous-

ensembles d’items fermés fréquents d’un contexte formel, la base propre BP

pour les règles d’association approximatives est : BP {r : ( \ )tel que, ∈ FF ⊂et confiance(r)≥minconfiance}. Les règles de la base propre sont appelées "règles

d’association approximatives propres".

Luxemburguer démontre que la base propre pour les implications partielles n’est

pas minimale relativement au nombre de règles qu’elle contient et défini une base qui

est un sous-ensemble de la base propre. Cette base, appelée base de couverture. Cette

dernière est représentée en détail dans [Pasquier 2000].


23

Exemple

Ensemble des fermés Règles d’association Le support La confiance

3/6

2/6

2/6

4/6

2/6

2/6

4/6

3/5

2/5

2/3

4/5

2/4

2/5

4/5

Table II.5 : Base propre de Luxenburguer extraite du contexte formel D

pour un min-support=2/6 et min-confiance=2/5

En conclusion, l’utilisation de l’ACF et la notion sous-jacente de fermé permet

de réduire le temps d’extraction des règles d’association et d’améliorer la pertinence

des résultats de l’extraction de fait qu’elle ne génère pas des règles d’association

redondantes.

II.6.2. La recherche d’information

La recherche d’information est une branche de l’informatique qui s’intéresse à

l’acquisition, l’organisation, le stockage, la recherche et la sélection d’information.

Pour une vision simple, la recherche d’information consiste à " trouver les documents

correspondent aux mots de la requête posée par l’utilisateur ". Pour ce faire, on est

amené à considérer une relation binaire Documents×Termes. Cette relation est souvent

représentée par une table avec en ligne des documents et en colonne des termes. Etant

donné une relation R, l’intersection d’une ligne et d’une colonne indique si un terme

‘t’ appartient ou n’appartient pas au document ‘d ’.


24

ExempleEtant donné un ensemble fini de documents D, un ensemble fini de termes T et

une relation binaire R telle que pour un couple ( , ) ∈R, représente le fait que le

terme∈ T est présent dans le document ∈R t1 t2 t3 t4

d1 × ×d2 ×d3 × ×d4 × × × ×

Table II.6: Relation binaire terme-document

L’évidente analogue entre la relation binaire Objets×Propriétés caractérisant

l’ACF et une relation d’incidence de type Documents×Termes caractérisant la

recherche d’information à rapidement suscité un engouement certain pour l’utilisation

de l’ACF en recherche d’information. Dans ce cas les documents correspondent à des

objets formels et les termes d’indexation (descripteurs, éléments de thésaurus, etc.)

correspondent aux propriétés formelles [Priss 2000]. Les concepts formels résultant

d’une telle relation peuvent être interprétés comme des paires ({réponse}, {requête})

où la requête correspond à l’intension du concept tandis que la réponse correspond à

son extension. La relation de subsomption (relation d’ordre partiel) entre concepts

formels peut être considérer comme une relation de spécialisation/généralisation entre

requêtes [Messai et al 2005]

Nous pouvons remarquer que dans le contexte formel illustré dans la table II.4,

les seules informations que nous pouvons extraire c’est l’appartenance ou non

appartenance du terme au document. Cependant dans le domaine de la recherche

d’informations cette appartenance n’est pas toujours égale à 0 ou à1, mais appartient

plutôt à l’intervalle [0, 1].


25

Ceci nous permet de nous placer dans le contexte flou fondé sur la théorie des

ensembles flous que nous détaillerons dans les sections qui suivent.

II.6.3. La classification

Dans le domaine de l’aide à la décision (informatique décisionnelle et entrepôt de

données) et du Data mining, la classification est utilisée pour répartir une population

d’individus (de client par exemple) en groupes homogènes selon un ensemble de

variables discriminantes (l’âge, le sexe, la profession, etc.). En fonction d’un objectif

fixé et connu (en fonction par exemple : du chiffres d’affaires, de réponses à un

mailing, etc.). L’arbre de décision est un outil de classification considéré parmi les

plus importantes méthodes de la machine Learning (machine d’apprentissage)

[Dunham 2003], [Quinlan 1993], [Tan 2006]. Plusieurs méthodes (algorithmes) ont été

proposées pour la construction de l’arbre de décision à partir d’une collection

d’enregistrements décrite par des vecteurs d’attributs.

Définition 17 (Arbre de décision)

Un arbre de décision est un outil d’aide à la décision et à l’exploration des

données. Il permet de modéliser simplement graphiquement un phénomène mesuré

plus au moins complexe. L’arbre de décision est une représentation par arbre des

valeurs finies d’une fonction selon des valeurs finies de ses attributs. Le crucial but est

de construire un arbre de décision relatif à une fonction, décrite partiellement par une

table (qui représente une relation binaire), afin qu’elle produira une meilleure

classification des données. L’arbre de décision est constitué par un ensemble de nœuds

et de segments. Chaque nœud de l’arbre de décision est étiqueté par un attribut nommé

attribut de décision, ce dernier représente un test, selon le résultat du test les

enregistrements sont divisés en plusieurs classes. Pour mieux illustrer l’induction des

arbres de décision, nous présentons l’exemple suivant :


26

Exemple

Dans cet exemple nous allons présenter deux arbres de décision ou bien deux

classifications différentes de la fonction F :

A B C F(A, B, C)

Good Yes false yes

Good No false no

Bad No false no

Good No True yes

Bad Yes True yes

Table II.7 : table représentant la fonction F

Figure II.5 : Deux arbres de décision représentant la fonction F

Selon Belohlavek [Belohlavek 2006], l’analyse de concepts formels peut

apporter une solution au problème de classification. L’analyse de concepts formels

génère deux résultats, le premier c’est un treillis de concepts formels vu comme une

représentation hiérarchique de concepts formels. La seconde est les dépendances entre

attributs constituant une base non redondante appelée implication entre attributs. Un

treillis de concepts formels (sans le plus petit élément ou bien l’élément vide) peut être

vu comme une collection chevauchée d’arbres, alors un arbre de décision peut être

déduit en choisissons un de cette collection. Pour ce faire l’auteur propose un

truefalse

B

yes

yes

no

C

yes

no

yesno

no

B

yes

yesno

C

true

yes

no

B

yes

False

Agoodbad


27

algorithme qui repose sur deux essentielles étapes. La première étape consiste à

construire le treillis de concepts, la seconde étape porte sur la sélection de l’arbre de

décision.

Dans la première étape, l’auteur génère le treillis de concepts d’une manière

itérative en rajoutant à chaque fois le concept voisin comme suit : le voisin direct de⟨ , ⟩= {⟨ , ⟩ / = ( ∪ { })∆∆ tel que ∈ P - }.

Dans la deuxième étape, l’auteur sélectionne l’arbre de décision qui répond à la

meilleure classification. D’abord pour chaque concept c=⟨ , ⟩, il calcule le nombre Lc

qui correspond au nombre de concepts voisins placés en dessous du concept considéré.

La sélection est réalisée d’une manière itérative débutant du concept ayant le plus

grand nombre de concepts voisins jusqu’au concept ayant le plus petit nombre de

concepts voisins.

II.7. Conclusion

Dans ce chapitre nous avons d’abord présenté l’analyse de concepts formels de

manière intuitive afin d’en faciliter la compréhension. Nous avons présenté par la suite

les notions mathématiques sous-jacentes à la théorie de l’analyse de concepts formels.

Nous avons essentiellement mis l’accent sur certaines propriétés algébriques des

opérateurs de dérivation de Galois notamment la propriété de fermeture. De nouveaux

opérateurs de dérivation ont aussi été présentés. Enfin nous avons présenté quelques

applications de l’analyse de concepts formels.

Il s’avère que l’analyse de concepts formels basée sur des relations Booléennes

(ACF classique) peut présenter certaines insuffisances car la réalité présente souvent

des valeurs qui ne sont pas Booléennes mais de diverses natures (floues,

intervalles,…). Pour cela, nous sommes amenés à considérer des cadres théoriques

plus appropriés comme la théorie des ensembles flous pour étendre


28

l’analyse de concepts formels classique à l’analyse de concepts formels floue. A ce

titre, le chapitre suivant présente la théorie des ensembles flous.

Chapitre III Théorie des ensembles flous

29

III.1. IntroductionLa théorie des ensembles flous a été introduite par Lotfi Zadeh en 1965

[Zadeh 1965]. Zadeh étant automaticien, le domaine d’application initial des

ensembles flous était la commande floue. Cependant, les ensembles flous ont reçu une

attention dans de nombreux autres domaines et spécialités. Parmi les domaines

utilisant cette théorie, se trouve la représentation des connaissances imprécises,

incertaines, vagues, floues, manquantes. Les ensembles flous sont aussi utilisés pour

représenter des informations sous forme linguistique assimilable par un système expert

(les variables linguistiques).

Les ensembles flous ont permis aussi d’étendre l’analyse de concepts formels,

notamment en ce qui concerne la prise en compte des relations floues objet ×attributs et la génération d’opérateurs de fermeture et d’ouverture flous.

Dans la suite de ce chapitre, nous confondrons ensemble flou et sous-ensemble

flou et utiliserons indifféremment ces deus appellations sachant qu’un sous-ensemble

de manière générale est lui-même un ensemble.

III.2. Rappels sur la théorie des ensembles flousSoit U un univers de discours, un sous-ensemble flou F dans U est entièrement

défini par une fonction d’appartenance qui associe à chaque élément u de U son

degré d’appartenance à l’ensemble F. Ce degré d’appartenance est noté ( ).(généralement( ) ∈ [0, 1] ).

Un ensemble flou discret F peut être représenté comme suit :

F= ( )/ + ( )/ + + ( )/Ou bien F ={ ( )/ , ( )/ , … , ( )/ }

Le degré d’appartenance ( ) exprime la caractéristique de transition graduelle et

non brutale entre l’appartenance complète et la non appartenance totale de l’élément

à l’ensemble F tel que :


30

= 0 non appartenance totale ( n’appartient pas du tout à F).( ) : ∈]0, 1[ plus ( )se rapproche de 1, plus u appartient à F.

=1 appartenance complète ( appartient complètement à F).

Exemple 1

Supposons que nous voulions définir l’ensemble des personnes de taille

moyenne. En théorie des ensembles dits classiques, nous conviendrons que les

personnes de taille moyenne sont celles dont la taille est comprise entre 1m 60 et 1m

80. La fonction caractéristique de l’ensemble classique (non flou) des personnes de

taille moyenne donne "0" pour les tailles hors de l’intervalle [1m 60 et 1m 80] et "1"dans cet intervalle. C'est-à-dire, une personne mesurant 1m 59 ne sera pas considérée

de taille moyenne, alors qu’une personne plus grande d’un centimètre sera considérée

de taille moyenne

(voir Figure III. 1).

Les ensembles flous ont été introduits pour exprimer une transition graduelle

entre la non appartenance totale et l’appartenance complète. Aussi dans l’exemple 1,

l’ensemble flou des personnes de taille moyenne sera ainsi défini par une "fonction

d’appartenance" qui diffère d’une fonction caractéristique classique par le fait qu’elle

peut prendre n’importe quelle valeur dans l’intervalle [0,1]. A chaque taille possible

correspondra un "degré d’appartenance" dans l’ensemble flou des personne de taille

moyenne. Ce degré d’appartenance est généralement compris entre 0 et 1 (voir Figure

III. 2).

Figure III.1 : Fonction caractéristique Figure III.2 : Fonction d’appartenance

(Ensemble classique) (Ensemble flou)

1

1m60 1m80

0

1

()

01m70taille taille


31

Un ensemble flou comporte certaines caractéristiques, que nous présentons

succinctement ci-dessous.

Définition 1 (Le noyau)

Le noyau d’un sous-ensemble flou F de U, noté Noy(F), est l’ensemble de tous

les éléments qui lui appartiennent complètement, il est représenté par :

Noy(F)= {u ∈U | ( ) = 1}

Définition 2 (Le support)

Le support d’un sous-ensemble flou F de U, noté Supp(F), est l’ensemble de tous

les éléments qui lui appartiennent au moins un petit peu, il est représenté par :

Supp(F)= {u ∈U | ( ) > 0}

Définition 3 (La hauteur)

La hauteur d’un sous-ensemble flou F de U, notée h(F), est la valeur maximale

atteinte sur tout le support de F, d’où :

h(F)= Sup ∈ ( )

La hauteur d’un ensemble flou F est définie aussi comme étant : ‘la borne

supérieure de la fonction d’appartenance , aussi n’est pas nécessairement atteinte’

Sous-ensemble flou normalisé

Un sous-ensemble flou est dit normalisé si sa hauteur est égale à 1.

Définition 4 ( -coupe)

La coupe (resp. coupe stricte) de niveau de l’ensemble flou F noté (resp.

) est l’ensemble usuel composé des éléments dont le degré d’appartenance à F est

au moins égal (resp. strictement supérieur) à . Elles sont définies comme suit :

= {u ∈ U, (u)≥ }

= {u ∈ U, (u)> }


32

Les propriétés suivantes sont valides [Dubois 2000]

F1= noy(F) = Supp(F)

L’ensemble des coupes de niveau de F sont emboîtées au sens où :

Si > ′ ⊆Une coupe de niveau d’un ensemble flou a deux vues : une vue horizontale (voir

Figure III.3) et une vue verticale (voir Figure III.4).

E

1

1, , , ,…, sont les niveaux de coupe, tel que : 1> > > >…>

Figure III.3 : Vue horizontale d’ensemble flou : -coupes

:F = la trentaine

10 20 30 40 50 60 Age (en années)

F1=noy(F)

F0,5

Supp (F)

F0

Figure III.4 : Vue verticale d’une -coupe sur l’ensemble flou normalisé " la

trentaine "

0,5

1


33

Les coupes de niveau établissent un lien naturel entre ensemble flou et

ensemble usuel qui permet d’exprimer un ensemble flou par ses interprétations plus ou

moins exigeantes ou relaxées en termes de -coupes. Une propriété intéressante des -

coupes est l’ensemble des éléments propres d’une coupe qui définissent une partition

de l’ensemble flou.

Définition 5 (L’ensemble des éléments propres d’une coupe)

L’ensemble des éléments propres d’une coupe, noté ( ), est l’ensemble des

éléments de qui n’appartiennent à aucune coupe de niveau strictement supérieur à, on a alors :( )= {u| u∈ et ∀ ′ > , u ∉ }

Un ensemble flou peut être reconstitué à partir des ses -coupes en considérant

les éléments propres de chaque coupe.

Définition 6 (Cardinalité d’un ensemble flou)

La cardinalité d’un sous-ensemble flou F de U, est le nombre d’éléments

appartenant à F pondéré par leur degré d’appartenance. Pour un ensemble flou F fini,

on a donc :

Card (F)= ∑ ∈ ( ).Cette définition évalue " combien " d’éléments contient l’ensemble F. Elle supposeque :

- les degrés d’appartenance sont numériques,

- le support de F est fini.

Dans le cas de support infini, on peut utiliser l’intégrale de la fonction d’appartenance

d’un ensemble flou sur son support, s’il existe, on aura donc :

Card (F)=∫ (u) du


34

III.3. Les opérations ensemblistes flous

Les opérations usuelles définies sur les ensembles classiques (intersection, union,

complémentation, etc.). ont été généralisées aux ensembles flous. Les opérations

ensemblistes sur les ensembles flous sont généralement définies à partir des fonctions

d’appartenance.[Amroun 2008]

III.3.1. Intersection et union d’ensembles flous

Soient F et G deux ensembles flous. L’intersection (resp. l’union) des ensembles

F et G est un ensemble flou H dont la fonction d’appartenance est définie à partir des

fonctions d’appartenance de F et G comme suit :

Intersection: ∀ ∈U , ( ) = ∩ ( ) = ( ( ) ⊗ ( ))Union: ∀ ∈U , ( ) = ∪ ( ) = ( ( ) ⊕ ( ))

Où ⊗ désigne une t -norme,⊕ désigne une t -conorme.

Normes et co-normes triangulaires

Les normes triangulaires (t-normes) et les co-normes triangulaires (t-conormes)

permettent de généraliser les opérations ensemblistes d’intersection et d’union

respectivement (et par extension la conjonction et la disjonction de proposition) sur les

sous-ensembles flous. Pour que cette généralisation soit correcte, un certain nombre de

propriétés doivent être vérifiées. Les définitions et les propriétés respectives des

normes et conormes sont données ci-après.

Définition 7 (t-norme)

Une t-norme (appelée aussi norme triangulaire) est une fonction⊗:[0, 1]×[0, 1]→[0, 1] qui possède les propriétés suivantes ∀ , , , ∈ [0, 1]:

Commutativité : ( ⊗ ) = ( ⊗ )

Associativité : ⊗ ( ⊗ )= ( ⊗ ) ⊗ Monotonie : ( ⊗ )≤ ( ⊗ ) si ≤ ou ≤


35

1 est l’élément neutre : ( ⊗ 1)= ,

de plus elle assure que ∀ , ∈[0,1] , ( ⊗ )≤ et ( ⊗ )≤ .Définition 8 (t-conorme)

Une t-conorme (appelée aussi conorme triangulaire) est une fonction ⊕ :

[0,1]×[0,1]→[0,1] qui possède les propriétés suivantes∀ , , , ∈[0,1] :

Commutativité : ( ⊕ ) = ( ⊕ ),

Associativité : ( ⊕ ( ⊕ ))= ( ( ⊕ ) ⊕ ),

Monotonie : ( ⊕ ) ≤ ( ⊕ ) si ≤ ou ≤ ,

0 est l’élément neutre : ( ⊕ 0)= ,

de plus elle assure que ∀a, ∈ [0,1] , ( ⊕ )≥ et ( ⊕ )≥ .Il existe une infinité de normes et conormes, les plus courantes sont données dans le

tableau ci-dessous.

Norme : ( ⊗ ) Co-norme associée ( ⊕ ) Auteur

Min ( , ) Max ( , ) Zadeh

Max ( + -1, 0) Min ( + , 1) Lukasiewicz

/ + (1- )(a+b-ab) + - b - (1- )/1-(1- ) Hamacher

Si b=1

Si =1

0 Sinon

Si b=0

Si =0

1 Sinon

Weber

Table III.1 : Les principales normes et conormes triangulaires

Remarque :

le minimum est la plus grande t-norme de la famille des t -norme,

le couple Min /Max représente de nombreux avantages qui le rend particulièrement

intéressant (exemple : la simplicité de calcul, distributivité de l’opération

d’ - par rapport à l’intersection et l’union,

soit (F ∩ G) = ∩ et ( ∪ ) = ∪


36

l’inconvénient du minimum (resp. maximum) est de ne pouvoir discriminer entre

deux situations où des paires de degrés sont comparées avec une valeur minimale

(resp. maximale) commune. Ainsi, Min(0.7, 0.2)= Min(0.3, 0.2) = 0.2

III.3.2. Le Complément

Le complément d’un ensemble flou F est défini habituellement par μ ( ) =1 − μ ( ), ∀ ∈U. C’est la manière la plus simple pour exprimer l’évidente

condition que les éléments dont le degré d’appartenance à F est le plus élevé sont ceux

dont le degré d’appartenance à son complément est le plus bas.

III.3.3. Le produit cartésien

Lorsque les problèmes considérés sont décrits dans plusieurs univers de référence

U1, U2,…Un, il est plus intéressant de pouvoir raisonner dans un univers de référence U

global composé de chacun des univers initiaux. De ce fait, U correspond au produit

cartésien de U1, U2,… Un :

U= U1× U2,…× Un , et ses élément u sont des n-uplets : u= (u1, ...un)

Le produit cartésien de n sous-ensemble flous F1…..Fn définis respectivement sur

les univers de référence U1, U2,…Un est un sous ensemble flou F définis sur U par sa

fonction d’appartenance :∀ ∈U, = (u1, ...un) ∈U, μ ( ) = (μ ( ), … μ ( ) )


37

III.3.4. les relations floues et la composition de relations

Soient deux ensembles de référence U et V, une relation R est représentée entre

U et V par un sous-ensemble flou de U × V dont la fonction d’appartenance μR

est

définie par μR

U × V→ [0, 1]. La relation R est notée R (U, V).

La composition de deux relations floues R1 sur U×V et R2 sur V×W est une relation

R= R1 R2 de U×W dont la forme la plus utilisée est décrite par la fonction

d’appartenance μR

comme suit:∀( , ) ∈ U×W: μR

( , ) = ∈ (μ ( , ), μ ( , ))

Définition 9 (Composition Sup-Inf)

Soient F un ensemble flou dans U. La composition sup-inf de relation floue

R(U, V)est un ensemble flou G dans V, notée par G= R . La composition sup-inf est

définie par la fonction d’appartenance μR∘F comme suit : μR∘F ( )= {μ (u)μR( , ) Où = Sup et = Inf,

Soit R1(U, V) et R2 (V, W) deux relations floues. La composition sup-inf R1

R2est une relation d’appartenance μ R1∘ R2 donnée par :μ ( , ) = {μ ( , ) ∧ μ ( , )}, ∀(u, w)∈ U×V et ∀ v∈ V

Définition 10 (Relation inverse)

Soit R une relation floue sur U ×V. son inverse R -1 est une relation floue sur

V ×U tel que : ∀( , ) ∈V ×U, μ ( , )= μ ( , )Propriétés des relations floues

Une relation floue R (U, V) est dite :

1. Réflexive : Ssi ∀ ∈U , μ ( , )=1,


38

2. Symétrique : Ssi ∀ 1, 2 ∈U, µR( 1, 2)= µ

R( 2, 1)

3. t-norme transitive : ∀ 1, 2, 3∈ U, µR( 1, 3)≥ (µ

R( 1, 2) ⊗ µ

R( 2, 3))

III.3.5. L’égalité

Deux sous-ensembles flous F et G sont égaux si leurs fonctions d’appartenance

sont égales en tout point de U :

F=G ∀u ∈ U,μ ( )=μ (u)

III.3.6. L’inclusion

Une façon habituelle de définir l’inclusion d’un ensemble F dans un ensemble

G repose sur l’expression : (F⊆G) (∀ ∈U (u ∈ ) (u ∈ ))

Cette dernière expression s’étend canoniquement à deux ensembles flous F′ et G′

comme suit:

(F′ ⊆ ′) (∀ ∈ U, μ (u) ≤ μ (u))

Une définition plus exigeante de l’inclusion est donnée par :

(F′ ⊆ ′) (∀ ∈U, (u ∈ supp( ′)) ( ∈ Noy( ′)))III.4. Les implications floues

D’ordinaire, l’implication → exprime une liaison entre les valeurs des

propositions p et q. Elle rend vraie lorsque la proposition q est vraie ou quand la

proposition p est fausse, d’où les valeurs de vérité données dans la table III.2.

qp

Vrai Faux

Vrai Vrai Faux

Faux Vrai Vrai

Table III.2: table de vérité de l’implication classique (non flou) →Plusieurs approches d’extension de l’implication peuvent être envisagées lorsque

les propositions p et q prennent, non plus une valeur booléenne, mais une valeur floue


39

dansl’intervalle [0, 1]. Toute implication floue est une fonction (notée ) définie par :: [0,1] × [0,1] → [0,1]( , ) ( ) (1)

et elle est d’autant plus vraie (resp. fausse) que son résultat est proche de 1(resp. 0).

Les implications floues se divisent principalement en deux familles à savoir les S-

implications et les R-implications que nous présentons ci-après.

III.4.1. S-implications

L’appellation S-implication vient de l’expression anglaise Strong implication.

On définit la classe des S-implication (notée S) à partir de l’expression : ((non p) ou

q) de la manière suivante:

p q = (1- p⊕ q)

Où la disjonction (ou) est généralisée par une conorme (noté ⊕).

Il existe une infinité de S-implications, parmi lesquelles les trois les plus

courantes sont données dans la table III.3

Nom Symbole Valeur de vérité Conorme sous jacente

Kleene- Dienes K-D Max (1-p, q) ( ⊕ ) = Max ( , )Reichenbach Rb 1-p + p ∗ q ( ⊕ ) = p+q-p∗q

Lukaseiwicz Lu Min (1- p + q, 1) ( ⊕ ) = Min ( + , 1)Table III.3: les principales S-implications

De plus, l’ordre suivant sur les S-implication précédentes est valide.

(p K-D q) ≤(p Rb q) ≤(p Lu q)


40

L’implication de Kleene-Dienes est la plus petite des S-implications (puisqu’elle est

construite à partir de la plus petite des conormes). La plus grande (notée S-M) est

trouvée en prenant la co-norme de Weber, soit :

p→S-M q= (1 − ) si = 0si = 11 sinonRemarque

Comme pour l’implication usuelle, on a : ( 0) = (1-p ⊕ 0)=1-p

Les implications de cette classe sont leur propre contraposée car d’après laformule (1), on a : non non p = (1-(1-q) ⊕1-p)= (q ⊕ 1-p)= (1-p ⊕q)= (p q ).III.4.2. R-implication

La seconde classe d’implications floues est la R-implication, ainsi dénommées

parce qu’elles utilisent le principe de résiduation. Une R-implication (notée ) est

définie comme suit :

p R q = Sup [0, 1] {u ∈ [0, 1] | (p ⊗ u) ≤ } (2)⊗ étant une norme triangulaire.

Il y a donc une infinité de R-implications. Les plus courantes figurent dans la

Table III.4 avec la norme triangulaire (génératrice) qui leur est associée. L’implication

de Rescher Gaines peut être vue comme une R-implication particulière prenant en

argument des propositions floues en rendant un résultat Booléen, dérivant de la

formule voisine de la formule (2) à savoir :

p R-G q = {u∈ {0,1} | (p ⊗u)≤ }

= 1 si ≤0 sinonet ce, pour toute norme ⊗. De façon analogue aux S-implications, ces implications

peuvent être ordonnées : (p R-G q) ≤(p Gö q) ≤(p Gg q) ≤(p Lu q)


41

Nom Symbole Valeur de vérité Norme sous-jacentes

Gödel Gö1 si ≤q sinon

(p⊗ q)= min (p, q)

Goguen Gg1 si ≤q/p sinon

(p⊗ q)= p q

Lukasiewicz Lu1 si ≤1-p+q sinon

(p⊗ q)= max (p+ q-1,

0)

Table III.4 : les R-Implications les plus courantes

L’implication de Gödel est la plus petite R-Implication propre (i.e., en excluant

celle de Rescher Gaines), puisque elle est construite à partir de la plus grande norme

triangulaire. La plus grande (notée R-M) est celle construite à partir de la plus petite

norme (celle de Weber), soit :

p R-M q =1 si ≤si > = 11 si > < 1

où 1- désigne une valeur limite strictement inférieure à 1 (le comportement discontinu

de cette implication provient de celui de la norme triangulaire sous-jacente).

Quelques caractéristiques des implications floues

Les implications floues présentées précédemment généralisent toutes les

implications usuelles (appelées aussi implications matérielles), en ce sens que leur

résultat coïncide avec celui de l’implication usuelle quand les valeurs en entrée sont

vrai et/ou faux. En effet, pour les S-implications, 1 étant un élément absorbant et 0 un

élément neutre de toute co-norme, nous avons :

(faux S faux) = (1 ⊕ 0) = 1,

(vrai S vrai) = (0 ⊕ 1) = 1,

(vrai S faux) = (0 ⊕ 0) = 0,

(faux S vrai) = (1 ⊕ 1) = 1.


42

De façon analogue, pour les R-Implications et leurs contraposées :

(faux R faux) = (1 ⊕ 0) = 1,

(vrai R vrai) = (0 ⊕ 1) = 1,

(faux R vrai) = (1 ⊕ 1) = 1,

(vrai R faux) = (0 ⊕ 0) = Sup[ , ] {u | (1⊗ u)≤ 0 }

=Sup[ , ] {u | u ≤ 0 }= 0

Le fait que l’implication de Rescher-Gaines satisfait cette propriété est aisément

vérifiable.

Les deux classes d’implications floues considérées auparavant possèdent les propriétés

suivantes caractérisant les implications floues selon [Yager 1980].

P vrai =1,

faux q =1,

vrai q =1,

> ( q) ≥ ( r),

< ( q) ≥ ( q).

Sémantique associée aux implications floues [Amroun 2008]

Au-delà de ces aspects, il apparaît particulièrement important de s’intéresser à

la signification qui peut être attribuée aux diverses implications floues. Ceci permet en

particulier de procéder à un choix approprié et d’en expliciter le sens. Les S-

implications (Kleene-Dienes, Reichenbach et Lukasiewicz) présentent la

caractéristique de garantir un niveau de satisfaction minimal de (1-p). De plus, pour

l’implication de Kleene-Dienes, p joue le rôle d’un niveau d’importance attribué à la

conclusion q. En effet, si p est faible, on " voit " seulement les valeurs élevées de q,

contrairement au cas où p est élevé pour lequel q est " vue " sur une plage de valeurs

large (1-p est faible quand q est grand et donc l’intervalle [1-p, 1] sur lequel on " voit "q est grand).


43

Pour ce qui est des R-implications, la valeur de la prémisse p joue le rôle d’un

seuil qui conduit à la totale satisfaction quant il est atteint ou dépassé par la valeur de

la conclusion q et à une satisfaction partielle sinon. Dans ce dernier cas, le degré

obtenu ne dépend que de la conclusion avec l’implication de Gödel, varie avec le

ratio entre la valeur de la conclusion et celle de la prémisse avec l’implication de

Goguen et avec leur écart (ou distance) avec l’implication de Lukasiewicz.

III.5. Conclusion

Dans ce chapitre nous avons présenté en détail la théorie des ensembles flous.

Nous avons présenté différents opérateurs algébriques mais nous avons

particulièrement mis l’accent sur les implications floues qui sont à la base de la

spécification d’opérateurs de dérivation de Galois flous tel que nous allons le voir dans

le chapitre suivant.

Chapitre IV Analyse de concepts formels floue

44

IV.1. IntroductionDans le modèle de base proposé par Wille [Wille 1982], l’analyse de concepts

formels concerne des relations binaires et booléennes appelées contextes formels. De

plus, ce modèle repose sur les deux suppositions suivantes : i) la relation est

Booléenne et ne peut prendre une autre valeur que vrai ou faux, ii) l’information est

complète (parfaitement renseignée) c.à.d. il est toujours connu que l’objet possède ou

ne possède pas la propriété).

Il s’avère que l’analyse de concepts formels est souvent amenée à considérer des

contextes formels (relations) de diverses natures, modélisant des réalités concrètes

(mesure, observation, jugement, etc.). où peuvent apparaitre des données incomplètes

(imprécises, incertaines, floues, vagues, partiellement renseignées, ou même

manquantes). [Djouadi 2009]. Dans pareils cas, le modèle de base proposé par Wille

s’avère inapproprié. L’exemple de la table IV.1 illustre différents cas de données

incomplètes.

Propriétés

Objets

Jeune Anglais Marié

Rachid 1 0,9 oui

Fatima 0,7 ]0, 1] ?

Anis 0,6 0 non

Amina 1 [0.2, 0.4] (0.7 ;0.0)

Table IV.1 : Contexte formel flou

La première colonne de la table IV.1 contient des valeurs appartenant à

l’intervalle [0, 1]. Elle indique le degré de satisfaction de la propriété graduelle Jeune.

La seconde colonne indique le niveau de maîtrise de l’Anglais. Ce niveau peut être

connu de manière précise ou seulement apprécié sous forme d’intervalles. La troisième

colonne illustre la présence d’incomplétude et d’incertitude : Alors que Rachid est

marié et Anis ne l’est pas, rien ne peut être affirmé pour Fatima (cas totalement non

informé) d’où l’absence totale de valeur.


45

En modélisant l’état épistémologique d’une connaissance partielle (cas

partiellement informé) sur le mariage de Amina par la théorie des possibilités [Zadeh

1978], la paire (0.7 ;0.0) exprime que la possibilité que Amina ne soit pas marié est de

0.0 et de 0.7 qu’elle le soit.

A ce titre, plusieurs approches ont proposé d’étendre l’analyse de concepts

formels classique à des relations non Booléennes. Certaines de ces approches sont

basées sur la théorie des ensembles flous [Zadeh 1965] et permettent de modéliser des

relations floues où la notion de satisfaction de la relation est maintenant représentée

par un degré d (généralement d ∈ [0, 1]). Notre mémoire s’inscrit dans ce type

d’approches et nous nous limitons aux valeurs floues (comme celles de la première

colonne de la Table IV.1).

Dans cette section nous allons présenter les notions essentielles concernant

l’analyse de concepts formels concernant des contextes formels (relations) flous que

nous appellerons analyse de concepts formels floue.

IV.2. Contexte formel flou et Concepts formels flousL’analyse de concepts formels floue repose sur la notion de contexte formel flou.

Un contexte formel flou comporte une relation binaire floue entre un ensemble

d’objets et un ensemble d’attributs. Formellement, un contexte formel flou ou L-

contexte est un tuple K=(L, O, P, R) où la relation floue R ∈ L OP est une fonction

définie :O P L. Une relation floue R est représentée sous forme d’une table,

généralement les lignes représentent les objets et les colonnes représentent les

propriétés. Chaque cellule de la table exprime une valeur appartenant à L (L∈ [0, 1]).

L’ACF floue consiste à induire tous les concepts formels flous⟨ , ⟩ où est un

ensemble flou ( ∈ LO), est un ensemble flou ( ∈ LP) et △ = et △ = .

L’ensemble de tous les concepts formels flous est aussi équipé d’une relation d’ordre

définie comme suit :⟨ , ⟩ ⟨ , ⟩ ssi ⊆ ou ⊆ où l’inclusion floue est


46

ponctuellement définie par l’inégalité des fonctions d’appartenance respectives,

autrement dit : ⊆ ∀ ∈O : ( ) ≤ ( ).

Il a été aussi montré que, sous certaines conditions topologiques et algébriques,

l’ensemble de tous les concepts formels flous forme un treillis complet [Belohlavek

2005]. Parmi ces conditions, nous pouvons citer l’ouverture et la fermeture

topologique que nous définissons ci-après.

Définition 1 (Opérateur de fermeture flou)

Un opérateur de fermeture flou défini sur un ensemble U est une fonction :

LU LU satisfaisant ∀ U, V ∈ LU :

1- U⊆V ⇒ (U) ⊆ (V)

2- U ⊆ (U)

3- ( (U)) = ( )Définition 2 (Opérateur d’ouverture flou)

Un opérateur d’ouverture flou défini sur un ensemble U est une fonction :

LU LU satisfaisant ∀ U, V ∈ LU :

1- U⊆V⇒ (U) ⊆ (V)

2- (U) ⊆ U

3- ( (U)) = (U)

IV.3. ETAT DE L’ART

Il existe dans la littérature plusieurs approches concernant l’ACF floue. Burusco

et al [Burusco 1994] ont été les premiers auteurs à considérer des contextes formels

flous. Ils ont proposé l’utilisation d’une S-implication (de la forme ¬p ∨ q).


47

plusieurs approches sont venues par la suite [Pollandt 1997], [Latiri 2003],

[Belohlavek 2002], [Belohlavek 2005], [Ben Yahia 2007], [Medina 2009]. Toutes ces

approches reposent sur l’utilisation d’une algèbre résiduée. Avant de nous étendre sur

l’aspect algébrique, nous donnons les définitions suivantes :

IV.3.1. Rappels mathématiques

Définition 3 (Monoïde)

Etant donné un ensemble E et un opérateur ∗, on dit que (E, ∗, ) est un monoïde

si les trois propriétés suivantes sont vérifiées :

La stabilité : ∀ x, y ∈ E alors x∗y ∈ E

L’associativité : ∀ x, y, z ∈ E alors x∗(y∗ z)= (x∗ y)∗ z

L’élément neutre : ∃ ∈ E, ∀ x∈ E alors x∗ = ∗ =Un monoïde est dit régulier à gauche (resp. à droite) si ∀ x, y, z ∈ E, x∗ = x∗ z (resp.

y ∗x = z∗x) y=z

Un monoïde est dit commutatif ssi ∀ x, y ∈ E alors x∗ = ∗Définition 4 (Antitonie et isotonie)

Soient U et V deux univers, f et g deux opérateurs de fermeture, tels que f :

LU LV et g : LV LU. ∀A, B ∈ :

Isotonie : A⊆B ⇒ f g (A) ⊆f g(B)

Antitonie: A⊆B ⇒ f g (B) ⊆f g(A)

Définition 5 (Treillis résidué)

Un treillis résidué décrit par une structure algébrique L = (L, , ,∗, ) est un

treillis complet où (L, ∗) est un monoïde commutatif, est une implication floue et la

paire (∗, ) vérifie le principe de résiduation.


48

Définition 6 (Concept formel flou)

Un concept formel flou correspond à la paire ⟨ , ⟩ telle que ∆= et ∆= . On

peut remarquer que ∆∆= X et ∆∆ = , et sont donc des points fixes.

IV.3.2. Approches existantes

Il existe dans la littérature plusieurs approches dont la majorité est basée sur une

algèbre résiduée.

IV.3.2.1. Approche de Burusco et al.

Burusco et Fuentes Gonzales sont les premiers auteurs à avoir généralisé

l’analyse de concepts formels dans le cadre flou [Burusco 1994]. Leur approche est

basée principalement sur une S-implication de la forme pq. Soit L =⟨ , ≤, ′,⊕, 0, 1 ⟩une structure algébrique tel que ⟨ , ≤, 0, 1 ⟩ est un treillis complet, compris entre deux

valeur 0 et 1, ′ est un opérateur unaire de complémentation (on peut l’appelé aussi

opérateur de négation de Zadeh) et ⊕ est une t-conorme (rappelons nous que une t-

conorme ⊕ est un opérateur binaire, associatif, commutatif et il accepte 0 comme un

élément neutre) pour les deux ensembles flou ∈ (O est l’ensemble des objets) et∈ ( est l’ensemble des propriétés) l’auteur avait défini alors l’opérateur de

dérivation (. )∆ : LO L par :

∆( )= (∈ (x)′ ⊕R(x, ))

∆( )= (∈ (a)′ ⊕R(x, ))

Un treillis de concepts formel flous B (K ) est décrit par:

K={⟨ , ⟩ ∈ LO LP/ ∆ = et ∆ = , ∈ et ∈ }


49

Et définit un ordre partiel dans K entre ces concepts formels tel que : ⟨ , ⟩⟨ , ⟩ ssi ⊆ (ou ⊆ ).

Dans le papier [Burusco 1998] L’auteur avait démontré que si l’implication utilisée

vérifiait la condition: ≤ ≥ (pour , , ∈ O ), alors les deux

propriétés suivante sont vérifiées :

i) ≤ △ ≥ △, ∀ , ∈ LO

ii) ≤ △ ≥ △, ∀ , ∈ LP

Nous donnons dans ce qui suit un exemple dans lequel nous présentons deux concepts

formels générés par une S-implication.

Exemple

Soit le contexte formel suivant qui illustre une relation binaire entre les régions

{R1, R2, R3} (représentant les objets) et les propriétés du climat {chaud, froid,

pluvieux, humide}.

Climat

Région

chaud froid Pluvieux humide

R1 0.5 0.5 1.0 1.0

R2 1.0 0.0 1.0 1.0

R3 0.5 0.5 0.0 0.0

Table IV.2 : relation binaire floue régions/ climat

Nous appliquons dans ce qui suit une S-implication de Lukasievicz (notée par )définie par : p⊕q =Min(p+q, 1) et p q=Min(1, 1-p+q).


50

1) Soit (chaud/0.5, froid/0.5, pluvieux/1.0, humide/1.0)

∆( )= (∈ (x)′ ⊕R(x, ))

(R1)′ ⊕R(R1, )=

0.5 ⊕ 0.5 = min(0.5 + 0.5, 1.0) = 1.00.5 ⊕ 0.5 = min(0.5 + 0.5, 1.0) = 1.00.0 ⊕ 1.0 = min(0.0 + 1.0, 1.0) = 1.00.0 ⊕ 1.0 = min(0.0 + 1.0, 1.0) = 1.0=1.0

(R2)′ ⊕R(R2, )=

0.5 ⊕ 1.0 = min(0.5 + 1.0, 1.0) = 1.00.5 ⊕ 0.0 = min(0.5 + 0.0, 1.0) = 0.50.0 ⊕ 1.0 = min(0.0 + 1.0, 1.0) = 1.00.0 ⊕ 1.0 = min(0.0 + 1.0, 1.0) = 1.0=0.5

(R3)′ ⊕R(R3, )=

0.5 ⊕ 0.5 = min(0.5 + 0.5, 1.0) = 1.00.5 ⊕ 0.5 = min(0.5 + 0.5, 1.0) = 1.00.0 ⊕ 0.0 = min(0.0 + 0.0, 1.0) = 0.00.0 ⊕ 0.0 = min(0.0 + 0.0, 1.0) = 0.0=0.0∆( )= (R1/1.0, R2/0.5, R3/0.0)∆( ) = (∈ (a)′ ⊕R(x, ))

(chaud)′ ⊕R(x, chaud)=0.0 ⊕ 0.5 = min(0.0 + 0.5, 1.0) = 0.50.5 ⊕ 1.0 = min(0.5 + 1.0, 1.0) = 1.01.0 ⊕ 0.5 = min(1.0 + 0.5, 1.0) = 1.0

=0.5

(froid)′ ⊕R(x, froid)=0.0 ⊕ 0.5 = min(0.0 + 0.5, 1.0) = 0.50.5 ⊕ 0.0 = min(0.5 + 0.0, 1.0) = 0.51.0 ⊕ 0.5 = min(1.0 + 0.5, 1.0) = 1.0

=0.5


51

( pluvieux)′ ⊕R(x, pluvieux)=0.0 ⊕ 1.0 = min(0.0 + 1.0, 1.0) = 1.00.5 ⊕ 1.0 = min(0.5 + 1.0, 1.0) = 1.01.0 ⊕ 0.0 = min(1.0 + 0.0, 1.0) = 1.0

=1.0

(humide)′ ⊕R(x, humide)=0.0 ⊕ 1.0 = min(0.0 + 1.0, 1.0) = 1.00.5 ⊕ 1.0 = min(0.5 + 1.0, 1.0) = 1.01.0 ⊕ 0.0 = min(1.0 + 0.0, 1.0) = 1.0

=1.0

∆( ) =(chaud/0.5, froid/0.5, pluvieux/1.0, Humide/1.0)

Le concept formel obtenu est :⟨(chaud/0.5, froid/0.5, pluvieux/1.0, Humide/1.0), ( 1/1.0, 2/0.5, 3/0.0)⟩.2) Soit A=(1.0, 0.0, 1.0, 1.0)

Nous procédons de la même façon que 1 et nous trouvons :∆( )= (R1/0.5, R2/0.0, R3/1.0)∆( ) = (chaud/1.0, froid/0.0, pluvieux/1.0, humide/1.0)

Le concept formel est :⟨(chaud/1.0, froid/0.0, pluvieux/1.0, humide/1.0), (R1/0.5, R2/0.0, R3/1.0)⟩.Après l’approche classique de Wille [Wille 1982] sur l’analyse de concepts

formels, Burusco s’inscrit parmi les premiers autours qui ont ouvert la voie sur une

nouvelle théorie de l’analyse de concepts formels floue.

Néanmoins l’approche de Burusco a été critiquée par Belohlavek [Belohlavek

2005]. Il avait démontré que certaines propriétés utilisées dans cette approche ne

vérifient pas la propriété de fermeture. (Autrement dit la propriété d’extensivité "tout

ensemble est inclus ou égal à sa fermeture" n’est pas vérifiée par certaines S-

implication).


52

IV.3.2.2. Approche de Pollandt et Belohlavek

Pollandt [Pollandt 1997] et Belohlavek [Belohlavek 1998] sont parmi les

premiers auteurs qui avaient proposé d’utiliser un treillis résidué comme une structure

algébrique, ce qui revient à dire que leurs approches sont basées sur une R-implication.

Soit un L-contexte formel (L,O, P, R) ou O est l’ensemble des objets, P est

l’ensemble des propriétés et R une relation floue entre objet/propriété, pour les deux

ensembles flous ∈ LO et ∈ LP Pollandt et Belohlavek définissent l’opérateur de

dérivation (. )∆ : LO LP comme suit :

∆( )= (∈ (x) R(x, ))

∆( )= (∈ (a) R(x, ))

est une R-implication.∆( ) représente un degré de vérité de la propriété satisfaite par tous les objets de X

et ∆( ) représente un degré de vérité de l’objet satisfaisant toutes les propriétés de

. ⟨ , ⟩est un concept formel flou ssi ∆= et ∆= , et l’ensemble de ces concepts

formels flous forme un treillis complet défini par B (L,O, P, R)={⟨ , ⟩| ∆ =et ∆ = }. Toutes les propriétés citées ci-après sont démontrées dans [Belohlavek

1999]

Dans un treillis résidué on a les propriétés suivantes pour , , ∈ O, , ∈ Lp

i) ≤ ⊗ ≤ ⊗ (isotonie),

ii) ≤ ≤ (isotonie sur le second argument)

iii) ≤ ≤ (isotonie sur le premier argument)

on définit le degré de l’ensemble flou dans l’ensemble flou par , donné par

la formule suivante : d ( , )= ( )∈ ( ) [Goguen 1967]. ⊆ si , =1. Soient , ∈ LO alors : a) , ⊗ LB ( ) ⊗ (LB ≤ ( ≤ )b) , ⊗ UB ( ) ⊗ UB ( ) ≤ ( ≤ )


53

c) la paire ⟨(. )△, (. )△⟩ forme une connexion de Galois entre

l’ensemble des objets O et l’ensemble des propriétés P ssi : , △ ∈ ou, △ ∈ , △ = , △ tel que ∈ , ∈ et ∈Nous donnons dans ce qui suit un exemple dans lequel nous présentons deux concepts

formels générés par une R-implication.

ExempleConsidérons le contexte formel représenté dans la Table IV.2. Soit la R-

implication de Goguen (notée par ) définie comme suit := 1 si ≤/ sinonSoit à calculer :

∆( )= (∈ (x) R(x, ))

∆( )= (∈ (a) R(x, ))

1) Pour (chaud/0.5, froid/0.5, pluvieux/1.0, humide/1.0)

∆( )= (∈ (x) R(x, ))

(R1) R(R1, ) =

0.5 0.5 = 1.00.5 0.5 = 1.01.0 1.0 = 1.01.0 1.0 = 1.0=1.0

(R2) R(R2, )=

0.5 1.0 = 1.00.5 0.0 = 0.01.0 1.0 = 1.01.0 1.0 = 1.0=0.0


54

(R3) R(R3, )=

0.5 0.5 = 1.00.5 0.5 = 1.01.0 0.0 = 0.01.0 0.0 = 0.0=0.0

∆( )= (R1/1.0, R2/0.0, R3/0.0)

∆( )= (∈ (a) R(x, ))

(chaud) R( , chaud)=

1.0 0.5 = 0.50.0 1.0 = 1.00.0 0.5 = 1.0=0.5

(froid) R( , froid)=

1.0 0.5 = 0.50.0 0.0 = 1.00.0 0.5 = 1.0=0.5

(pluvieux) R( , pluvieux)=

1.0 1.0 = 1.00.0 1.0 = 1.00.0 0.0 = 1.0=1.0

(humide) R( , humide)=

1.0 1.0 = 1.00.0 1.0 = 1.00.0 0.0 = 1.0=1.0∆( ) = (chaud/0.5, froid/ 0.5, pluvieux/1.0, humide/1.0)

Le concept formel obtenu est :⟨ (chaud/0.5, froid/ 0.5, pluvieux/1.0, humide/1.0), ( 1/1.0, 2/0.0, 3/0.0)⟩.


55


Suivant les mêmes étapes nous obtenons le concept formel suivant:

⟨(chaud/1.0, froid/0.0, pluvieux/1.0, humide/1.0), ( 1/0.5, 2/1.0, 3/0.0)⟩IV.3.2.3. Approche de Georgescu et Popescu

Inspiré de l’approche de Belohlavek, Georgesco [Georgesco 2004] avait étendu

l’analyse de concepts formels floue pour considérer le cas d’une algèbre non

commutative. Dans cette approche, on considère " ∗ "un opérateur de conjonction non

commutatif et deux implications résiduées :" "une implication résiduée à gauche

vérifie la propriété : ≤ ssi ∗ ≤ et " " une implication résiduée à droite

vérifie la propriété : ≤ ssi ∗ ≤ . Pour un ensemble d’objets flou on

définit deux ensembles de propriétés en appliquant deux opérateurs de dérivation ↑et ⇑, les deux opérateurs ↑, ⇑ : sont définis comme suit :↑( ) = ( ( ) ( , ))∈⇑( ) = ( ( ) ( , ))∈On a aussi:⇑( ) = ↑( ) = ( ) ∗ ( , )∈ = ( ) ∗ ( , )∈ = ( ) ∗∈( , )De même pour un ensemble de propriétés flou on définit deux ensembles d’objets↓ et ⇓.les deux opérateurs ↓, ⇓: sont donnés comme suit :↓( ) = ( ( ) ( , ))∈⇓( ) = ( ( ) ( , ))∈On a aussi cette relation:⇓( ) = ̅↓( ) = ( , ) ( ) = ( ) ( , )∈∈ .


56

Comparé au cas commutatif, on aura ↑⇓↑= ↑ et ⇓↑⇓= ⇓, résultant ainsi deux

opérateurs de ferméture (↑⇓, ⇓↑) et (⇑↓, ↓⇑), alors on dit que l’ensemble d’objets est

fermé par rapport à (↑⇓,⇓↑) et l’ensemble des propriétés fermé par rapport à (⇑↓, ↓⇑).

Selon l’auteur un concept formel dans ce cas étudié, doit avoir une extension et deux

intensions décrivant la même extension, alors un concept formel est décrit par un

triplet ( , , ) tel que ↑ = , ⇓ = , ⇑ = et ↓ = .Un treillis résidué est une structure algébrique tel que :

i) ⟨L, , , 0,1⟩ est un treillis limité par les deux valeurs 0 et 1.

ii) ⟨ ,∗ ,1⟩ est un monoïde.

iii) deux implications l’une résiduée à gauche (noté par " ") et l’autre résidué à

droite (noté par " ").

Dans un treillis résidué complet les propriétés suivantes sont

vérifiées [Georgescu 2004]:

i) ≤ ssi = 1 et ssi = 1ii) 1 = 1 = 1 ; 1 = 1 =iii) , sont des antitone sur le 1er argument et isotone sur le seconde argument.

iiii)∗ est isotone.

IV.3.2.4. Approche dite "one sided fuzzy formal context "

Cette approche est aussi basée sur un contexte formel flou (L,O, P, R)

définissant une relation floue R entre un ensemble fini d’objets O et un ensemble flou

d’attributs P appartient à l’intervalle [0, 1]. Dans le cadre de la recherche

d’information [Latiri 2003] considère une relation entre un ensemble fini de

documents (représentent les objets) et un ensemble flou de termes de corpus

(représentent les attributs) ces termes sont caractérisé par des poids qui appartiennent

généralement à l’intervalle [0, 1]. Les concepts formels résultants d’une telle relation

peuvent être interprétés comme des paires ({réponse}, {requête}) où la requête

correspond à l’intension du concept tandis que les réponses correspond à son extension

[Messai 2005]. Dans [Ben Yahia 2007], l’auteur avait introduit dans le contexte formel

une ligne supplémentaire qui correspond à une contrainte c prédéfinie par un


57

utilisateur. L’ensemble de ces auteurs sont basés dans leurs études sur une implication

de Rescher Gaïnes, cette dernière donne comme résultat

0 ou 1.

Nous donnons dans ce qui suit un exemple dans lequel nous présentons deux concepts

formels générés l’implication de Rescher Gaïnes.

ExempleConsidérons le contexte formel représenté dans la Table IV.2. l’implication de

Rescher Gaïnes (notée par ) est définie comme suit := 1 si ≤0 sinonSoit à calculer :

∆( )= (∈ (x) R(x, ))

∆( )= (∈ (a) R(x, ))


∆( )= (∈ (x) R(x, ))

(R1) R(R1, ) =

1.0 0.5 = 0.00.0 0.5 = 1.01.0 1.0 = 1.01.0 1.0 = 1.0=0.0

(R2) R(R2, )=

1.0 1.0 = 1.00.0 0.0 = 1.01.0 1.0 = 1.01.0 1.0 = 1.0=1.0

(R3) R(R3, )=

1.0 0.5 = 0.00.0 0.5 = 1.01.0 0.0 = 0.01.0 0.0 = 0.0


58

=0.0

∆( )= (R1/0.0, R2/1.0, R3/0.0)

∆( )= (∈ (a) R(x, ))

(chaud) R( , chaud)=0.0 0.5 = 1.01.0 1.0 = 1.00.0 0.5 = 1.0

=1.0

(froid) R( , froid)=0.0 0.5 = 1.01.0 0.0 = 0.00.0 0.5 = 1.0

=0.0

(pluvieux) R( , pluvieux)=

0.0 1.0 = 1.01.0 1.0 = 1.00.0 0.0 = 1.0=1.0

(humide) R( , humide)=0.0 1.0 = 1.01.0 1.0 = 1.00.0 0.0 = 1.0

=1.0∆( ) = (chaud/1.0, froid/ 0.0, pluvieux/1.0, humide/1.0)

Le concept formel obtenu est :⟨ (chaud/1.0, froid/ 0.0, pluvieux/1.0, humide/1.0), ( 1/0.0, 2/1.0, 3/0.0)⟩.2) Pour (chaud/1.0, froid/1.0, pluvieux/1.0, humide/1.0)

Suivant les mêmes étapes nous obtenons le concept formel suivant:

⟨(chaud/1.0, froid/0.0, pluvieux/1.0, humide/1.0), ( 1/0.0, 2/0.0, 3/0.0)⟩IV.3.2.5. Approche basée sur les -coupes


59

Il existe des approches basées sur des coupes de niveau α pour des contextes

flous. Pour chaque α ∈ L positif, on peut définir la relation classique Rα=

{⟨ , ⟩:R⟨ , ⟩ ≥ α }, et en extraire les concepts formels ⟨ , ⟩ (on a alors ∀x ∈ ,∀ ∈ , ⟨ , ⟩ ∈ R). Un concept flou peut ensuite être reconstruit à partir de

l’ensemble de ses coupes de niveau α qui sont des concepts classiques à la coupe de

niveau α du contexte flou. Le choix de l’opérateur ∗ doit préserver l’égalité ∗=⟨ × ⟩ .

Exemple

Soit le contexte formel illustré dans la table IV.3 représentant une relation binaire

floue entre un ensemble des objets O= {x, y, z, t} et un ensemble des propriétés

P= {a, b, c, d}.

R a b c d

x 0.5 1.0 0.7 0.5

y 0.6 0.7 1.0 0.5

z 1.0 0.9 1.0 0.1

t 1.0 0.9 0.9 0.1

Table IV.3 : Table Représentant le contexte formel flou D


60

Pour =0.8, nous définissons le nouveau contexte formel D′ comme suit :

R (x, a)= 1 si ( , ) ≥ α0 sinon Pour chaque x∈O et a∈P

Le contexte D′ obtenu est un contexte formel non flou. Pour mieux le représenté.

Nous préférons remplacer 1 par une crois et 0 par un vide.

R a b c d

x

y

z

t

Table IV.4 : Table représentant le contexte formel non flou D′ pour =0.8

Liste des concepts formels⟨{∅}, { , , , }⟩ .⟨{ , , }, { } ⟩ .⟨{ , , }, { }⟩ .⟨{ , }, { , , }⟩ .⟨{ , , , }, {∅}⟩ .Table IV.5 : Table représentant les concepts formels du contexte D′


61

IV.4. Généralisation des opérateurs de dérivation deGalois au cas flou

Les opérateurs de dérivation de Galois définis dans la section II à savoir

l’opérateur de nécessité, l’opérateur de possibilité et l’opérateur de suffisance duale,

ont été étendus au cas flou. Cette génération correspond à des fonctions définies entre

les parties floues LO et LP comme suit :

∆( )= (∈ ( (x) R(x, ))

( )= ( ( )∈ ∗ R (x, ))

( )= (∈ R (x, ) ( ))

∇( )= (~ ( )∈ ∗ ~ R (x, ))

est une implication floue et ∗ est une conjonction floue.

Comme déjà indiqué dans [Dubois 2009], les paires ⟨ , ⟩ telles que =

et = caractérisent des sous contextes (i.e. qui n’ont en commun ni objets ni

propriétés) à l’intérieur du contexte initial.

La satisfaction des propriétés de fermeture (i.e. ∆( )= ( ( )∈ R( , ))) pour

la construction de Galois floue passant par le choix d’une structure algébrique

(L, , ,∗, ), appropriée. La composition d’opérateurs de nécessité et de possibilité

n’est pas symétrique (i.e.(.)NП ≠ (.)ПN, où (.)NП =((. )П)N [Djouadi 2009]. Les deux

théorèmes suivants caractérisent alors chacun une algèbre minimale pour la

construction d’un opérateur de fermeture et d’ouverture (.)ПN.

Théorème IV.1 [Djouadi 2011] : soit L= (L, , ,∗, ), la composition d’opérateurs

.(.)NП est un opérateur de fermeture flou si la paire (∗, ) vérifie la propriété :

b≤a (a ∗b) ∀ , ∈L


62

Théorème IV.2 [Djouadi 2011] : soit L=(L, , , ∗, ), la composition d’opérateurs

(.)ПN est un opérateur d’ouverture flou si la paire (∗, ) vérifie la propriété :

a ∗ ≤b ∀ , ∈ L.

Topologiquement parlant, (.)NП est un opérateur de fermeture qui fournit une

approximation haute, tandis que l’opérateur (.)ПN est un opérateur d’ouverture qui

fournit une approximation basse, de l’ensemble auquel on applique ces opérateurs. En

effet, ( )ПN⊆ ⊆ ( )NП. Les concepts formels ainsi obtenus correspondront à des

paires ⟨ , ⟩ tel que sera un point fixe au sens de la fermeture et sera un point fixe

au sens de l’ouverture ( = N, = П) ou inversement (( = П, = N)).

IV.5. Application de l’ACF floue en RI [Djouadi 2011]

L’application de l’analyse de concepts formels pour la recherche d’information

(RI) était parmi les 1èr soucis ambitieux des chercheurs. Un contexte formel décrit une

relation binaire entre un ensemble de documents (correspondant aux objets) et un

ensemble de termes (correspondant aux attributs). Alors que classiquement les seuls

degrés figurant dans cette relation sont 0 ou 1, traduisant la présence ou l’absence d’un

terme dans le document du corpus ; dans la pratique ces degrés appartient plutôt à

l’intervalle [0, 1]. Ceci nous permet de nous placer dans le contexte flou fondé sur la

théorie des ensembles flous.

L’analyse de concepts formels floue reflète la richesse de l’information que

peut représenter un contexte formel flou. Dans le cadre de la recherche d’information,

la façon dont les attributs d’un contexte formel sont exploités diffère en fonction de la

nature de l’information à extraire d’une part et des connaissances supplémentaires dont

on dispose sur ces attributs d’autre part. Cependant dans le domaine de la recherche

d’information nous disposons du poids d’un terme dans un document qui peut être une

information importante à intégrer dans le processus de découverte de règle

d’associatives entre termes ou encore lors de l’interrogation en RI.


63

Définition 7 (Poids d’un terme dans un document)

Le poids d’un terme dans un document est le produit de la fréquence d’apparition

du terme par la fréquence inversée du document, donné par la formule suivante :

Pij=tfij idfj.

tel que :tfij :"term frequency" mesure la représentation du terme ti dans le document dj

et idfj. : :"inverted document frequency" :mesure par contre le pouvoir de

discrimination du terme ti dans le document dj.

Définition 8 (Relation binaire floue)

Un contexte formel K (O, P, R) décrit une relation binaire entre un ensemble de

documents (correspondant aux objets) et un ensemble de termes (correspondant aux

attributs).comme le montre l’exemple suivant :

R t1 t2 t3 t4

d1 0.90 0.70 0.60 0.20

d2 0.70 0.45 0.76 0.70

d3 0.66 0.88 0.00 0.00

d4 1.00 0.66 0.60 0.73

Table IV.6 : Relation binaire floue termes/documents

L’ensemble des objets O ={d1, d2, d3, d4}, et l’ensemble des attributs P ={t1, t2, t3, t4}.

Le couple ⟨ , ⟩ ∈ R représente le fait que est présent dans le document avec un

degré appartient à l’intervalle [0, 1].

Dans [Latiri 2003], l’auteur propose deux manière pour évaluer de manière

pratique le degré d’appartenance entre terme /document R( , ), une première mesure

globale basée sur le poids d’un terme dans un document et la seconde qui est locale

basée sur la fréquence d’un terme dans un document. Selon l’auteur, les

expérimentations menées sur des corpus réels ont montré que la deuxième mesure


64

locale illustre plus fidèlement le degré d’appartenance d’un terme dans un document.

IV.6. Problématique

Au niveau méthodologique

Actuellement les approches existantes [Pollandt 1997][Belohlavek

1998][Georgesco 2004] utilisent une implication résiduée c.à.d. telle que ( ≤⇔ ∗ ≤ ). Le fait d’utiliser une implication résiduée restreint considérablement

le nombre d’implications éligibles pour l’ACF floue.

Notre première contribution se situe au niveau méthodologique et consistera à :

a) Prouver une algèbre minimale (plus faible que la résiduation). Une telle algèbre

induit un ensemble d’implications floues plus général (plus grand) que

l’ensemble des implications résiduées.

b) Déterminer les conditions requises pour la fermeture topologique floue de

l’opérateur (. )∆∆Au niveau opérationnel



d’approche dans la littérature proposant la construction intégrale de ce treillis (car

infini). Pour éviter à avoir un treillis infini, les approches existantes proposent de

discrétiser L=[0, 1] par exemple [Belohlavek 2010] utilise un ensemble fini L={0.0,

0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1 }. D’autres approches [Chunzhi 2006] ne

calculent que la fermeture d’un sous-ensemble précis de concepts formels.

Notre deuxième contribution consistera à :

a) Mettre en évidence quelques implications floues qui engendrent un ensemble fini de

concepts formels


65

b) Proposer les algorithmes permettant de déterminer de manière effective et efficace

l’ensemble des concepts formels.

IV.7. ConclusionDans ce chapitre, nous avons présenté la théorie de l’analyse de concepts

formels floue en décrivant d’abord ses fondements mathématiques, par la suite nous

avons abordé différentes approches existantes. Comme nous avons mis l’accent sur la

généralisation des opérateurs de dérivation de Galois au cas flou, nous avons présenté

quelques théorèmes portant sur la notion de fermeture et d’ouverture floue. Enfin nous

avons présenté un domaine d’application de l’analyse de concepts formels floue et

nous avons opté pour le domaine de la recherche d’information.

L’analyse de concepts formels floue est un domaine très vaste. Ce chapitre n’a

été en fait qu’un aperçu sur ce domaine. Par conséquence, les notions que nous avons

voulu détailler sont celles qui s’apparentent à notre problématique. Nous avons

considéré seulement les valeurs floues singulières. C.à.d. des valeurs scalaires

appartenant à l’intervalle [0, 1].

Dans le prochain chapitre, nous allons présenter notre contribution qui apportera

des éléments de réponse aux différents points de la problématique énumérés dans la

section IV.6.

Chapitre V Contribution

66

V.1. Introduction

La notion cruciale de l’ACF est la relation binaire (nommée le contexte formel)

entre un ensemble d’objets et un ensemble d’attributs. Des approches basées sur la

logique floue ont été proposées pour induire les concepts formels flous du contexte

basé sur la connexion de Galois classique (i.e (. )∆∆). Actuellement, la tendance

générale de l’ACF consiste à utiliser une algèbre résiduée pour maintenir les propriétés

de fermeture. Dans ce qui suit, nous allons présenter notre contribution qui se décline

selon deux aspects. Un premier aspect méthodologique qui renforce les fondements

théoriques de l’ACF floue en élargissant les algèbres actuellement utilisées. Un

deuxième aspect opérationnel et constructif exhibe deux implications : La première est

l’implication de Gödel, La seconde est l’implication de Dienes Nilpotent, cette

dernière est une implication non résiduée. dans ces deux cas, nous proposeront les

algorithmes de construction de l’ensemble des concepts formels flous. En faisant

remarquer qu’aucune approche existante ne propose un algorithme complet de

construction de l’ensemble de concepts formels.

V.2. Proposition d’une algèbre minimale

En 1994 Burusco et Fuentes Gonzales [Burusco 1994] ont proposé une approche

basée principalement sur une S-implication. Cette dernière est de la forme pq.

En 2005 Belohlavek [Belohlavek 2005] a critiqué l’approche de Burusco et il a

démontré qu’elle ne vérifie pas la propriété de la fermeture. L’auteur propose alors

d’utiliser une implication résiduée (une R-implication).

Actuellement la majorité (pour ne pas dire toutes) des approches existantes

[Pollandt 1997], [Belohlavek 1998], [Latiri 2003], [Geogescu 2004], [Ben Yahia

2007], [Zhang 2007], [Medina 2009], etc. sont fondées sur une algèbre résiduée. Ces

auteurs sont essentiellement guidés par le souci de maintenir la propriété de la

fermeture de la connexion de Galois, sans autant poser la question sur la possibilité de

définir une algèbre minimale non résiduée et qui satisfait la propriété de fermeture.


67

Le théorème V.1 prouve cette algèbre minimale. Cette dernière est plus faible

que la résiduation, comme elle peut élargir l’ensemble des implications éligibles

induites.

Avant de donner cette algèbre, nous définissons c’est quoi une implication floue.

Définition 1 (Une implication floue)

Une implication floue est une fonction (noté par ) définie de LL L

satisfaisant :

a) ≤ ′ pour ′ ≤b) ≤ ′ pour ≤ ′c) 0 0 =0 1 =1 1=1

d) 1 0 =0

Théorème V.1

Soit L=⟨ ,,, , ⟩ une algèbre floue où ⊗ représente une t-norme, (L, ⊗) un

monoïde et une implication floue. K = (L, O, P, R) un L-contexte formel, le couple⟨(. )△, (. )△⟩ est une connexion de Galois antitone et (. )△△ est un opérateur de

fermeture flou si la propriété suivante est satisfaite ∀ , ∈ L : ≤ ( ) .

Démonstration

Pour démontrer le théorème V.1 il suffit de montrer que la connexion de Galois

satisfait :

i) les propriétés de fermeture suivante pour , ∈ :

Cl1) ⊆ △△ ⊆ △△Cl2) ⊆ △△Cl3) △△△△ =1) la propriété CL1

Soient , ∈ (Pour , ∈ , c’est la même démonstration)⊆ ( ) ≤ ( ) ∀ ∈ O


68

( ( ) ( , )) ≤ ( ) ( , ) ∀ ∈ O( ( ) ( , )) ( , ) ≤ ( ( ) ( , )) ( , )△( ) ( , ) ≤ ( △( ) ( , ))△( ) ( , )∈ ≤ ( △( ) ( , ))∈△△( ) ≤ △△( ) ∀ ∈ O

Alors △△ ⊆ △△2) la propriété CL2

Cette propriété est prouvée en considérant l’avantage de discrimination de

l’implication sur le premier argument et en utilisant la propriété ≤ ( )△( ) = ( ( ) ( , ))∈△( ) ≤ ( ( ) ( , )) ∀ ∈ O( ( ) ( , )) ( , ) ≤ ( △( ) ( , ))( ) ≤ ( △( ) ( , ))( ) ≤ ( △( ) ( , ))∈ ∀ ∈ O( ) ≤ ( △△( )) ∀ ∈ O⊆ △△3) la propriété CL3

△( ) ≤ ( ) ( , )( ) ( , ) ( , ) ≤ ( △( ) ( , ))( △( ) ( , )) ( , ) ≤ (( ( ) ( , ) ( , ))( , )En appliquant la propriété ≤ ( ) on aura△( ) ( , )∈ ≤∈ ( ( ) ( , ))△△△( ) ≤ △( )△△△ ≤ △…….(1)

Or nous avons ⊆ △△ . En remplaçant par △ on aura △ ⊆ △△△……(2)

(1) et (2) △ = △△△ donc △△ = △△△△


69

Dans la pratique, nous pouvons donner ces deux contre exemples illustrant deux

implications non résiduées et satisfaisant la propriété ( ≤ ( ) ) donc

satisfaisant aussi les propriétés de la fermeture de connexion de Galois, pour dire

qu’une implication résiduée implique qu’elle respecte la propriété de fermeture de la

connexion de Galois, mais l’inverse n’est pas automatiquement vrai.

Exemple 1

Soit une algèbre floue L=⟨[0, 1],∧,∨ ,0,1, ∽⟩ et (∗, ) une paire d’opérateurs flous

vérifiant : ∽ = 1 − , ∗ = ∧ et = 1 si ≤(1 − ) sinonCette implication est l’implication de Dienes Nilpotent. Elle est remarquable, elle peut

être obtenue par la disjonction de l’implication de Gödel (lorsqu’ elle est égale à q) et

sa contraposé (c.à.d. ∽ =1- ). Nous pouvons remarquer facilement que cette

algèbre ne vérifié pas le principe de résiduation (c.à.d. ≤ ⇔ ∗ ≤).Démonstration

Pour démontrer que l’algèbre ci-dessus n’est pas résiduée il suffit de donner le

contre exemple suivant : Soient =0,2, =0,3 et =0,1 alors :≤ ⇔ ∗ ≤≤ (1 − ) ⇔ ∧ ≤0,2 ≤0.7⇔0,2≤0,1

Donc cette algèbre n’est pas résiduée


70

Nous démontrons ci-après que cette algèbre vérifie la propriété ≤ ( )(donc les propriétés de fermeture de la connexion de Galois).

Démonstration

Nous avons : = 1 si ≤(1 − ) sinon1) ≤( ) = 1

=0

= donc ≤ ( )2) >2.1) (1- ) ≤( ) =

=1 et p≤1

Alors ≤ ( )2.2) (1- ) >( ) = (1- )

=1-(1- ) =

=

Alors ≤ ( )Ainsi nous avons démontré que cette algèbre vérifie la propriété ≤ ( )donc les propriétés de fermeture de la connexion de Galois sans être pour autant une

implication résiduée.


71

Dans cette démonstration nous avons considéré tous les cas, or nous pouvons

ignorer les deux premiers cas (le cas où l’implication a comme résultat 1 ou q) car on

obtient l’implication de Gödel et cette dernière est résiduée.

Exemple2

Considérons nous une implication tri-valuée (noté par ) définie :

{0, , 1} {0, , 1} {0, , 1}. Comme la montre la Table V.1.

0 1 ( ) 0 1

0 1 1 1 0 0 0 0

1 1

1 0 0 1 1 1 1 1

Table V.1 : à gauche (resp. à droite) valeurs de vérité de (resp.de( ) )Il est facile de remarquer dans la Table V.1 que l’implication tri-valuée " "

vérifie la condition ≤ ( ) mais elle n’est pas résiduée.

Démonstration

Soit à vérifier la satisfaction du principe de semi-résiduation suivant ( ∗ ≤≤ ) tel que la conjonction floue ∗ vérifie la condition ∗1= .

Soit le contre exemple suivant : = 1, = = alors :

1∗ ≤ 1 ≤⇔ ≤ 1 ≤ (car selon la Table V.1 = )

Ce contre exemple montre que le principe de semi résiduation n’est pas vérifié par

l’implication tri-valuée alors elle n’est pas résiduée.


72

Conclusion

Le théorème V.1 apporte une contribution théorique qui permet d’élargir

l’ensemble des implications floues éligibles à l’ACF floue. A ce titre les deux contre

exemples présentés montrent que nous pouvons avoir des algèbres non résiduées et qui

vérifient la propriété de fermeture et de connexion de Galois, il suffit que cette algèbre

respecte la propriété ≤ ( ) .

V.2. Génération des concepts formels flous

Pour la génération des concepts formels flous, nous commençons d’abord par

démontrer que pour certaines implications que nous allons déterminer, l’ensemble des

concepts formels est fini. Parmi ces implications : implication de Gödel et

l’implication de Dienes Nilpotent.

V.2.1. Finitude

Dans ce qui suit nous montrerons que l’ensemble des concepts formels généré

par l’implication de Gödel ou Dienes Nilpotent est fini.

Proposition 1

Soit K = (L, O, P, ) un L-contexte tel que L=[0, 1], O est l’ensemble des

objets, P est l’ensemble des propriétés, est une relation binaire. L’ensemble des

concepts formels est fini pour l’implication de Gödel.

Démonstration

Puisque l’ensemble de toutes les intensions est isomorphe à l’ensemble de toutes

les extensions il suffit de montrer que l’ensemble des extensions est fini.△△( ) = ( △( )∈ ( , ))= 1 si △( ) ≤ ( , )( , ) sinon∈


73

Ainsi il apparait que △△( ) ∈ { , } ∪ {1} tel que , appartient au

contexte formel. Puisque le contexte formel est fini nous pouvons déduire que

l’ensemble des extensions est fini. Donc l’ensemble des concepts formels est fini.

Pour déterminer tous les fermés, il suffit d’énumérer les valeurs de l’ensemble L

dans { ( , ), ∈ , ∈ } du majorant au minorant de l’ensemble des concepts

forˇmels flous (ou inversement). La proposition suivante caractérise ces éléments.

Notons par 1 , 1 , 0 et 0 les ensembles flous particulier définis tel

que :1 ( )=1 et 0 ( )=0 ∀ ∈ (resp. 1 ( )=1 et 0 ( )=0 ∀ ∈ , notons aussi que :

Oˆ( ) (resp.Oˇ( )) tel que Oˆ( ) = ( , )∈ (resp.Oˇ( ) = ( , )∈ ∀ ∈,) et Oˆ( ) (resp.Oˇ( )) tel que Oˆ( ) = ( , )∈

(resp.Oˇ( ) = ( , )∈ ∀ ∈ )

Proposition 2

Pour l’implication de Gödel, le majorant et le minorant de l’ensemble de

concepts formels flous B(K ) est donné par :(⟨ , ⟩ B(K ))=⟨Oˆ(O ) , 1 ⟩et (⟨ , ⟩ B(K ))=⟨ 1 ,Oˆ(P )⟩

Démonstration(. )△△est isotone alors : ∀ ∈ : 0≤ O ≤1 0△△( ) ≤ △△( ) ≤ 1△△( )i) Déterminons l’ensemble 0△△0△( ) = (∈ 0 ( , )0△△( ) = (∈ (∈ 0 ( , )) ( , ))= (∈ 1 ( , )) puisque (0 )= 1 ∀ ∈= ( , )∈ car (1 )= 1∀ ∈


74

ii) Déterminons l’ensemble 1△△1△△( ) = (∈ (∈ 1 ( , )) ( , ))= (∈ (∈ ( , ) ( , ))= 1 = 1∈

correspond à l’implication de Gödel et Dienes Nilpotent (autrement dit, les

démonstrations i) et ii) sont vérifiées soit pour Gödel soit pour Dienes Nilpotent.)

Proposition 3 [Djouadi 2010]

Soient deux sous ensembles X, Y∈LO (resp. A, B∈LP) tel que X⊆Y, si Y⊆ △△(resp. B⊆ △△) alors △△ = △△ (resp. △△ = △△).

Cette proposition sera utilisée dans notre algorithme. Elle est utile pour diminuer

le nombre de fermés éventuels.

Démonstration

En utilisant les propriétés de fermeture CL1, CL2 et CL3 définies précédemment.

Selon CL1 nous avons :

X⊆Y △△ ⊆ △△……….(1)

CL2 et CL3 :

Y⊆ △△ △△ ⊆ △△△△△△ ⊆ △△ .…(2)

(1) et (2) △△ = △△


75

V.2.2. Présentation de l’algorithmeL’algorithme proposé est conçu pour générer tous les concepts formels. Il est

déjà établi que l’ensemble des intensions est isomorphe à l’ensemble des extensions. Il

n’est donc pas nécessaire de générer l’ensemble des intensions et extension en même

temps. L’algorithme proposé est organisé selon deux procédures.

1- Une procédure principale GENERATION-INTENT-SET définit le Bottom et Top,

Comme elle initialise l’ensemble des intensions INTENT-SET et fait appel à une

procédure récursive RECURSIVE-CLOSURE.

Bottom : correspond à la plus petite intension, qui est égale à ˆ( ).

Top : correspond à la plus grande intension qui est égale à 1 ( ).

La procédure principale est donnée comme suit :

Algorithm GENERATION-INTENT-SET

Input: le contexte flou K =(L,O,P,R)

Output : INTENT-SET ensemble des intensions floues

Begin

1: Top ( ) 1 ∀ ∈ P ;

2: Bottom ( ) Oˇ ; ∀ ∈ P ;

3: INTENT-SET {Top} {Bottom} ;

4: RECURSIVE-CLOSURE (Bottom) ;

End

2- Une procédure récursive RECURSIVE-CLOSURE fait appel à elle-même pour

générer tous les concepts formels éventuels. Les notations suivantes sont utilisées par

l’algorithme


76

DIR-SUCC (Closed, aj) : c’est une fonction qui retourne le successeur directe de la

variable closed par rapport à la propriété aj. Le résultat (noté V) est donné comme

suit :

V(aj) = si > closed (aj) et ′ : > ′> closed (aj) sinon.

V(aj) = closed(ak) pour k≠j.

V(aj) = closed (aj) pour closed(aj)= Oˇ (aj).

La procédure récursive RECURSIVE-CLOSURE utilise la proposition 3 pour

diminuer le nombre de fermés éventuels (noté dans l’algorithme par la variables

closed).

Successor : correspond au successeur direct du dernier fermé (closed).

Closure : contient la fermeture du Successor.

Next : correspond au successeur direct de la dernière fermeture (Closure).

FLAG : une variable Booléenne utilisée pour éliminer les fermés déjà comptés.

Algorithm RECURSIVE-CLOSURE (closed)

Begin

1: j 1;2: FLAG TRUE

3: While (j≤ )and FLAG Do

4: Begin

5: Next DIR-SUCC(closed, )

6: While (Next≠ Oˇ ( ) and FLAG do

7: Begin /*il existe un successeur directe*/

8: successor closed ;

9: successor ( ) DIR-SUCC(closed, ) ;

10: closure (successor)△△ ;

11: if¬(closure ∈ INTENT-SET)

12: Then

13: INTENT-SET INTENT-SET {closure} ;14: RECURSIVE-CLOSURE(closure) ;


77

15: Next DIR-SUCC(closed, ) ;

16: Else

17: FLAG False ;

18: end If

19: End While

20: j++ ;

21: End While

End.

Exemple illustratif

Soit la relation floue R, entre un ensemble de régions et le climat, illustrée dans

la table V.2 tel que :

- l’ensemble d’attributs P = {chaud, pluvieux, humide}, les abréviations associées

sont respectivement {C, P, H},

- l’ensemble des objets O = {Région1, Région 2, Région 3, Région 4}, les abréviations

associées sont respectivement { R1, R2, R3, R4},

R Chaud Pluvieux humide

Région 1 0.0 0.2 0.3

Région 2 1.0 0.9 0.6

Région 3 0.0 0.4 0.1

Région 4 0.7 0.9 0.5

Table V.2 : contexte formel illustrant la relation R

L’algorithme se déroule comme suit :

Etape1 : Initialisation

La variable m=3.

Top et Bottom sont définis : Top= (C/1.0, P/1.0, H/1.0), Bottom= (C/0.0, P/0.2,

H/0.1).


78

INTENT-SET= {(C/1.0, P/1.0, H/1.0)}∪ {(C/0.0, P/0.2, H/0.1)}.

Etape 2 :

La procédure RECURSIVE-CLOSURE pour closed=(C/0.0, P/0.2, H/0.1) est

lancée. La variable Next alors prend la valeur 0.7 correspondant au successeur direct

du degré 0.0 (par rapport à l’attribut a1 ou bien C de la relation R). On assigne à la

variable successor (C/0.0, P/0.2, H/0.1) à la ligne 8 de l’algorithme, par contre à la

ligne 9, la variable successor devient (C/0.7, P/0.2, H/0.1). A la ligne 10 la fermeture

(closure) est calculée et donne (C/0.7, P/0.9, H/0.5).Ce dernier est rajouté à la liste

INTENT-SET. La procédure RECURSIVE-CLOSURE est lancée à nouveau pour

(C/0.7, P/0.9, H/0.5).

Etape 3 : Mi-parcours

La procédure RECURSIVE-CLOSURE est lancée pour (C/0.0, P/0.4, H/0.1), la

variable Next reçoit la valeur 0.7 correspondant au successeur direct du degré 0.0 (par

rapport à l’attribut a1 ou bien C de la relation R ). A la ligne 10 la fermeture du (C/0.7,

P/0.4, H/0.1) est calculée et la valeur (C/0.7, P/0.9, H/0.5) est associée. On constate

que cette dernière est déjà calculée et appartient à l’ensemble INTENT-SET, alors la

valeur FLAG reçoit la valeur "Faux".

Etape 4 :

La procédure arrive à sa fin lorsque tout les fermés potentiels sont générés.

La liste ci-dessous représente la liste des concepts formels correspondant au

contexte R décrit par la Table V.3


79

Liste des concepts formels⟨(0.0 0.2 0.1),(1.0 1.0 1.0 1.0)⟩; ⟨(0.0 0.2 0.3) , (1.0 1.0 0.1 1.0)⟩⟨(0.0 0.2 0.5),(0.3 1.0 0.1 1.0)⟩; ⟨(0.0 0.2 0.6),(0.3 1.0 0.1 0.5)⟩⟨(0.0 0.4 0.1),(0.2 1.0 1.0 1.0)⟩; ⟨(0.0 0.9 0.1),(0.2 1.0 0.4 1.0)⟩⟨(0.0 0.9 0.5),(0.2 1.0 0.1 1.0)⟩; ⟨(0.0 0.9 0.6),(0.2 1.0 0.1 0.5)⟩⟨(0.7 0.9 0.5),(0.0 1.0 0.0 1.0)⟩; ⟨(1.0 0.9 0.5),(0.0 1.0 0.0 0.7)⟩⟨(1.0 0.9 0.6),(0.0 1.0 0.0 0.5)⟩; ⟨(1.0 1.0 1.0),(0.0 0.6 0.0 0.5)⟩TableV.3 : liste des concepts formels de l’implication de Gödel

Implication de Dienes Nilpotent

Implication de Dienes Nilpotent est une implication non résiduée, La liste ci-

dessous représente la liste des concepts formels correspondant au contexte R décrit par

la

Table V.4 en appliquant l’implication Dienes Nilpotent

Liste des concepts formels flous⟨(0.0 0.2 0.1),(1.0 1.0 1.0 1.0)⟩; ⟨(0.0 0.2 1.0),(0.3 0.6 0.1 0.5)⟩⟨(0.0 0.9 0.1),(0.2 1.0 0.4 1.0)⟩; ⟨(0.0 1.0 0.1),(0.2 0.9 0.4 0.9)⟩⟨(0.0 1.0 1.0),(0.2 0.6 0.1 0.5)⟩; ⟨(1.0 0.9 0.5) , (0.0 1.0 0.0 0.7)⟩⟨(1.0 0.9 0.6),(0.0 1.0 0.0 0.5)⟩; ⟨(1.0 1.0 0.5),(0.0 0.9 0.0 0.7)⟩⟨(1.0 1.0 0.6),(0.0 0.9 0.0 0.5)⟩; ⟨(1.0 1.0 1.0),(0.0 0.6 0.0 0.5)⟩Table V.4: liste des concepts formels flous de Dienes Nilpotent

V.4. ConclusionDans ce chapitre, nous avons défini une algèbre minimale et nous avons montré

qu’elle respecte les propriétés de fermeture et les propriétés sous-jacentes de

connexion de Galois, en se basant sur l’implication résiduée de Gödel et l’implication

non résiduée de Dienes Nilpotent, nous avons montré la finitude du treillis des

concepts formels généré par ces deux implications. Nous avons terminé par un

exemple illustratif.

Chapitre VI Conclusion et perspectives

80

VI.1. ConclusionToutes les approches existantes [Pollandt 1997], [Belohlavek 1998], [Georgesco

2004] utilisent une implication résiduée. Dans ce mémoire nous avons défini une

algèbre non résiduée, qui délivre un ensemble d’implications floues plus générales,

cette algèbre vérifie la propriété ≤ ( ) . Nous avons montré que cette

algèbre respecte les propriétés de fermeture ainsi que celle de connexion de Galois. Par

la suite nous avons étudié deux implications floues qui définissent un ensemble fini de

concepts formels.

La première est l’implication de Gödel, l’avantage de cette dernière c’est que son

espace de fermeture est un ensemble fini, elle fournit une méthode constructive

efficace pour l’ensemble de tous les fermés.

La seconde est l’implication de Dienes Nilpotent, cette dernière n’est pas

résiduée, mais elle respecte les propriétés de fermeture.

VI.2. PerspectivesLe sujet abordé dans ce mémoire ouvre diverses perspectives, nous en présentons

quelques une.

Dans ce mémoire nous avons considéré un contexte formel qui représente une

relation binaire entre un ensemble d’objets et un ensemble de propriétés tel que la

valeur de cette relation appartient à [0, 1], la prochaine problématique que nous allons

traiter portera sur la construction d’un treillis de concepts formels pour un contexte

formel représentant une relation binaire entre un ensemble d’objet et un ensemble de

propriété et chaque valeur de cette relation est un intervalle [ , ] tel que ≤ et∈[0, 1],∈[0, 1].

Dans le cadre de la recherche d’information nous avons vu que seule

l’implication appliquée est celle de Rescher Gaïnes qui prend en argument des

Chapitre VI Conclusion et perspectives

81

propositions floues en rendant un résultat booléen. Il peut être plus intéressent

d’utiliser d’autre implications vues dans le chapitre III.

Annexes

82

Nous avons utilisé le langage de programmation Borland C++ Builder sous Windows

XP, cet outil est basé sur le concept de programmation orienté objet, comme il assure

une programmation modulaire.

Dans ce qui suit nous présentons les résultats obtenus en appliquant l’implication de

Gödel et Dienes Nilpotent sur le contexte formel représenté par la table V.2.

Résultat de l’application de Gödel pour le contexte formel représenté par la table V.2

Annexes

83

1. Résultat de l’application de Dienes Nilpotent pour le contexte formel représenté parla table V.2

84

Bibliographie[Agrawal 1993]: R. Agrawal, T. Imielinsky, and A. Swami: "Mining association rules

between sets of items in large databases". In proceeding of the 93

ACM SIGMOD international Conference on management of Data

(SIGMOD’93), pp 207-216, 1993.

[Agrawal 1994]: R.Agrawal et R.Srikant: "Fast algorithms for mining association rules

in large data base". In proceding of the 20th international conference

on very large Data bases (VLDB 94), pp 478-499,1994.

[Amroun 2008]: K. Amroun : "Découverte des dépendances fonctionnelles floues dans

des modèles relationnels sous imprécision". Mémoire de magister,

2008.

[Belohlavek 1999]: R. Belohlavek: "Fuzzy Galois connections". Math logic quart, pp 497-

504, 1999.

[Belohlavek 2002]: R. Belohlavek: "Fuzzy Relational Systems: Foundations and

Principles". Kluwer academic/ plunium publisher, New York, 2002.

[Belohlavek 2004 a]: R. Belohlavek: "Concept lattices and order in fuzzy logic". Ann Pure

Appl logic 128 (1-3), pp 277-298, 2004.

[Belohlavek 2004 b]: R. Belohlavek, M. Chlupova, V. Vychodid: "Implications from data

with fuzzy attributes". AISTA 2004 in cooperation with IEEE

computer society proceedings, ISBN 2-9599776-8-8, 2004.

[Belohlavek 2005]: R. Belohlavek, V. Vychodil: "What is a fuzzy concept lattice". Proc

CLA’05, Olomouc Czech republic, pp 34-45, 2005.

[Belohlavek 2010]: R. Belohlavek, B. De Baets, J. Outrata and V. Vychodil: "Fixpoints of

a fuzzy closure operatos". IEEE Transactions on fuzzy systems, Vol

18, pp 546-557. 2010.

85

[Ben Yahia 2007]: S. Ben Yahia, S. Ayouni :"Extraction compact and information

lossless set of fuzzy association rules". Fuzzy systems conference

2007, fuzzy-IEEE 2007. IEEE international, London, pp 1-6.

[Brin 1997]: S. Brin, R. Motwani, J. D. Ullman et S. Tsur: "Dynamic itemset

counting and implication rules for market data". In proceeding of the

1997 ACM SIGMOD international conference on management of

Data (SIGMOD’97), pp 255-264, 1997.

[Burusco 1994]: A. Burusco, R. Fuentes-Gonzalez: "The study of the L-fuzzy concept

lattice". Mathware and Soft computing 3, pp 209-218, 1994.

[Burusco 2001]: A. Burusco , R. Fuentes Gonzales: "Contexts with multiple weighted

values". International J. uncertainty, fuzziness and knowledge based

systems, 2001.

[Chen 1996] : M. Chen, J. Han et P.Yu: "Au overview from a data base perspective".

IEEE transaction on knowledge and Data engineering, 1996.

[Chunzhi 2006] : L. Chunzhi Y. Yajun: "An algorithm for fuzzy concept lattices

building with application to social navigation". School of Mathematics

and computer engineering, Xihua university, Chengdu 610039,

P.R.China, 2006.

[Djouadi 2009] : Y. Djouadi, H. Prade, D. Dubois : "Différentes extensions floues de

l’analyse formelle de concepts". Journée des treillis à Clermont-

Ferrand, 2009.

[Djouadi 2010] : Y. Djouadi, H. Prade : "Possibility-theoretic extension of derivation

operators in formal concept analysis over fuzzy lattices". Springer

science + Business media LLC, 2011.

[Djouadi 2011] : Y. Djouadi. "Extended Galois Derivation Operators for Information

Retrieval Based on Fuzzy Formal Concept Lattice". SUM'2011,

International Conference on Scalable Uncertainty Management,

Dayton, USA, 10-12 October 2011. LNCS 6929, pp 346-358.

86

[Düntsch 2003]: I. Düntsch, G. Gediga: "Approximation operators in qualitative data

analysis". Theory and application of relational structure as Knowledge

instrument, in computer science. Vol. 2929, pp 216-233, 2003.

[Dubois 2000]: D. Dubois, H. Prade: "Fundamentals of fuzzy sets". In kluwer

academic publishers, 2000.

[Dubois 2009]: D. Dubois, H. Prade: "Possibility theory and formal concept analysis

in information systems". Proc IFSA/ EUSFLAT’09, Lisbon, Portugal,

2009.

[Gardarin 1998]: G. Gardarin, P. Pucheral et F. Wu: "Bitmap based algorithms for

mining association rules". In Acts, des 14èmes journées des Bases de

données avancées (BDA’98), pp 157-175,1998.

[Ganter 1999]: B. Ganter, R. Wille: "Formal Concept Analysis". Mathematic

foundation. Springer- verlag, Berlin, 1999.

[Georgescu 2004]: G. Georgescu, A. Popescu: "Non dual fuzzy connection". Archive for

mathematical logic 43, 1009, 2004.

[Gunopulos 1997]: D. Gunopulos, R. Khardon, H. Mannila et H. Toivonen: "Data mining,

hypergraph transversals, and machine learning". In proceedings of the

16th ACM SIGACT-SIGMOD-SIGART, symposium on principles of

data base systems (PODS’97), pp 209-216, May 1997.

[Houtsma 1995]: M. Houtsma et A. Swami: "Set-oriented mining for association rules

in relational databases". In proceeding of the 11th international

conference on Data engineering (ICDE’95), pp 25-33, 1995.

[Järyinen 2007] : J. Järvinen, Jari Kortelainen : "A unifying study between modal-like

operators, topologies and fuzzy sets ". Turku center for computer

science (TUCS), university of Turku finland. Laboratory of applied

mathematics, Lappeenranta. University of technology, P.O. Box 20,

FI53851 Lappeenranta, Finland.

87

[Kegun 2004] : Q. Kegun, P. Zheng. "On topological properties of fuzzy rough sets".

Department of applied mathematics, Southwest Jiao tong, Chengdu,

Sichuan 610031, China college of computers and mathematical-

physical science,Xihua university, Chengdu, Sichuan, 610039, China.

[Latiri 2003] : C. Latiri, J. P Chevallet, S. Elloumi, A. Jaoua : "Une extension de la

connexion de Galois pour la recherche d’information". Revue

Cepadues Toulouse, France, 2003.

[Luxenburger 1991] : M. Luxenburger : "Implications partielles dans un contexte".

Mathématique, informatique et sciences humaines, 29(113), pp 35-55,

1991.

[Mannila 1994]: H. Mannila, H. Toivonen, et A. Verkamo : "Efficient algorithms for

discovering association rules. In AAAI’94 workshop on knowledge

discovery in Data bases, pp 181-192, AAAI press, 1994.

[Mannila 1997]: H. Mannila et H. Toivonen: "Levelwise search and bordres of theories

in knowledge discovery". Data mining and knowledge discovery, 1(3),

pp 214-258, 1997.

[Medina 2009]: J. Medina, M. Ojeda-Aciego et J. Ruiz-Calvino. "Formal concept

analysis via multi adjoint concept lattices ". Fuzzy sets and systems,

160 (2), pp130 -144, 2009.

[Park 1995]: J. S. Park, M. S. Yu. "An efficient hash based algorithm for mining

association rules using closed itemset lattices". Information systems

24(1), pp 25-46,1995.

[Pasquier 2000] : N. Pasquier: "Algorithmes d’extraction et de réduction des règles

d’association dans les bases de données". Université Clermont-

Ferrand II, Ecole Doctorale, sciences pour l’ingénieur de Clermont-

Ferrand, 2000.

88

[Pollandt 1997]: S. Pollandt: " Fuzzy Begriffe". Springer-Verlag, Berlin/ Heidelberg,

1997.

[Savasere 1995]: A. Savasere, E. Omeicinsky et S. Navathe: "An efficient algorithm for

mining association rules in large databases". In proceedings of 21st

international conference on very large Data bases (VLDB’95), pp 432-

444, 1995.

[Shao 2007]: M. Shao , W. Zhang: "Set approximations in fuzzy formal concept

analysis". Fuzzy sets and systems 158(23), pp 2627-2640, 2007.

[Silvertein 1998] : C. Silvertein, S. Brin, R. Motwani, et J.D.Ullman: "Techniue for

mining causal structures. ". In proceeding of the 24th international

conference on very large Data bases (VLDB’98), 1998.

[Toivonen 1996]: H. Toivonen: "Sampling large databases for association rules". In

proceedings for the 22nd international conference on very large Data

bases (VLDB’96), pp 134-145, 1996.

[Wille 1982]: R. Wille : "Restructuring lattice theory: An approach based on

hierarchies of concepts". In Rival, Dordrecht, Boston, pp 445-470,

1982.

[Wolff 1993]: K. E. Wolff : "A first course in formal concept analysis, how to

understand line diagrams". In faulbaum, F.ed. softStat’93, advances in

statistical soft ware 4, pp 429-439, 1993.

[Yager 1980]: R. R. Yager: "An approach to inference in approximate reasoning". In

journal of Main-machine studies, vol. 19, pp195-227, 1980.

[Yao 2006]: Y. Y. Yao, Y. Chen: "Rough set approximations in formal concept

analysis". Transaction on rough sets V, LNCS 4100, pp 285–305,

2006.

[Zadeh 1965]: L. Zadeh: "Fuzzy Sets In information and control". Vol. 08, pp. 338-

352, 1965.

89

[Zadeh 1978] : L. Zadeh: "fuzzy sets as basis for a theory of possibility, fuzzy sets

and systems". pp 3-28, 1978.

[Zaki 1998]: M. J. Zaki et M. Ogihara: "Theoretical foundations of association

rules". In DMKD’98 workshop on research issues in Data mining and

knowledge discovery, 1998.

[Zhang 2007]: W. Zhang: "Variable threshold concept lattices". Information sciences

177(22), pp 4883-4892, 2007.

Download - MEMOIRE · 2020. 5. 1. · 1 République Algérienne Démocratique et Populaire Ministère de l'Enseignement Supérieur et de la Recherche Scientifique Université M'hamed Bougara

Top Related