indexation : entre concept et percept, un problème dinterprétation bruno bachimont institut...
TRANSCRIPT
Indexation : entre concept et percept, un problème
d’interprétation
Bruno Bachimont
Institut National de l’Audiovisuel
Université de Technologie de Compiègne
3
Indexation : 2 points de vue
• Indexation documentaire :– Reformulation en un format exploitable pour la tâche
documentaire visée de la signifiance de la partie ou du tout d’un document.
– Recours aux ressources de la langue pour imposer un sens au document et expliciter cette signifiance.
• Analyse du contenu :– Extraction en un format exploitable de descripteurs à
partir du contenu physique du document.– Recours aux propriétés physiques du monde
représenté et de son encodage dans le document.
4
Problème
• L’indexation documentaire mobilise des index ;• L’analyse des contenus mobilise des
descripteurs ;• Les index et descripteurs expriment un point de
vue sur le contenu et correspondent à une conceptualisation du document :– Entre concept perceptif à la base des descripteurs et
concept distinctif à la base des index.
5
Concept distinctif
• Principe :– le concept distinctif est une position dans le
système de signification de la langue.
• Conséquence :– Le concept distinctif a pour signification et contenu
ce qui l’identifie et le distingue vis-à-vis des autres concepts.
• Origine :– Linguistique saussurienne : signifier, c’est différer.
6
Le signe saussurien: définition
« Le signe linguistique unit non une chose et un nom, mais un concept et une image acoustique. … Nous appelons signe la combinaison du concept et de l’image acoustique » (CLG)– Concept = signifié ;– Image acoustique = signifiant ;
7
Signe et réalité
• Langue & nomenclature – Les signifiés et signifiants ne préexistent pas aux
signes ;• Le signe co-institue signifiant et signifié ;
– La langue n’articule pas les signes aux choses :• Le rapport langue/réalité n’est pas du ressort de la
linguistique.« Prise en elle-même, la pensée est comme une nébuleuse où rien
n’est nécessairement délimité. Il n ’y a pas d ’idées préétablies, et rien n’est distinct avant l ’apparition de la langue. » (CLG, p. 155)
8
L’arbitraire du signe
• Distinguer :– Arbitraire du nom par rapport à la chose désignée ;
• Problème philosophique du signe comme lien naturel ou conventionnel à la chose;
– Arbitraire du signifiant vis-à-vis du signifié :• Arbitraire radical: « dix » et « neuf » ;• Arbitraire relatif : « dix-neuf » vis-à-vis de « dix » et
« neuf »;– Les signes peuvent se motiver entre eux.
9
La linéarité du signifiant
• Caractéristique de la langue, qui la distingue des autres systèmes de signes ;
• Notion de « syntagmes »;• Implique l’étude de la combinaison des unités
linguistiques sur l’axe du signifiant:– Syntaxe ;– Syntagmatique.
10
Le système de signes
• Signification :– Le concept, face signifié du signe linguistique ;
• Valeur :– La position qu’occupe ce signifié vis-à-vis des autres
signifiés de la langue.– La valeur se détermine en termes d’identités et
différences aux autres signifiés
• La langue est un système de valeur
11
Cékékidit, Saussure
• « dans l’intérieur d ’une même langue, tous les mots qui expriment des idées voisines se limitent réciproquement : des synonymes comme redouter, craindre, avoir peur n ’ont de valeur propre que par leur opposition ; si redouter n’existait pas, tout son contenu irait à ses concurrents. » (CLG, p. 119).
• « Quand on dit qu’elles [les valeurs] correspondent à des concepts, on sous-entend que ceux-ci sont purement différentiels, définis non pas positivement par leur contenu, mais négativement par leurs rapports avec les autres termes du systèmes. Leur plus exacte caractéristique est d ’être ce que les autres ne sont pas. »
12
Linguistique et indexation
• Indexer, c’est choisir une valeur dans un système:– Ce qui fait la valeur d’un index, c’est qu’il exclut les
autres index ;– Le sens d’un index consiste dans le fait qu’il nie les
autres.
13
Le concept « perceptif »
• Principe :– Le concept correspond à la catégorisation d’un
donné perceptif.
• Conséquence :– Le concept se détermine par rapport à un contenu
extra-conceptuel.
• Origine :– Abstraction aristotélicienne ;– Schématisation kantienne.
14
Concept et perception
• Dans l’analyse, il ne s’agit pas seulement de contenu perceptif, au sens d’un pur divers phénoménal ;
• Le contenu est catégorisé en moments perceptifs : formes, contours, couleurs, etc.
• Le contenu n’est pas brut, mais correspond déjà à une interprétation.
• La question est de savoir si les catégories utilisées font système ou non, si elles constituent ou non des index.
15
Concept perceptif et distinctif
…..ConducteurPréposéGendarme….
catégorisation
DistinctionOpposition
Rôle sur la route
Abstraction
16
Où en est-on ?
• Tout semble opposer les deux approches :– L’indexation documentaire repose sur le code
fonctionnel de la langue ;– L’analyse repose sur la perception du monde.
• Mais :– Le contenu analogique n’est pas le monde, mais une
représentation ;– L’interprétation du contenu n’est pas une perception
du monde, mais une interprétation fondée sur une représentation analogique.
17
Signification et intuition
• L’objet réel est pris pour lui-même et en lui-même.
• Si l’objet réel peut s’interpréter, il s’agit de sa propre interprétation : on interprète quelque chose en disant « ceci est une pipe ».
• Le signe est un objet qui vaut pour ce qu’il n’est pas : aliquid stat pro aliquo.
• Le signe s’interprète vers autre chose, via un interprétant.
• On dira : « ceci n’est pas une pipe ».
18
Signification et intuition
signification intuition
langage PerceptionSensibledu monde
image
?
• Si l’image est une intuition de l’être, les modèles du monde sont légitimes pour l’interpréter : point de vue de l’analyse des contenus ;
• Si l’image est langage, le code fonctionnel de la langue peut servir à exprimer et expliciter celui de l’image: point de vue de l’indexation documentaire.
19
Perception, conceptualisation
• Distinguer par conséquent :– « signe qui dit » : signe pour lequel la relation signifiant /
signifié est arbitraire ; la structure du signifié renvoie à un système fonctionnel.
– « signe qui montre » : signe pour lequel il existe une analogie ou ressemblance entre le signifiant et le signifié. Le signifié ne vérifie pas de code fonctionnel.
• Tous deux sont des signes : renvoi intentionnel vers ce qu’ils ne sont pas.
• Si l’image est un signe (qui dit) :– Ne pas appliquer « brutalement » les modèles du monde.– Construire pas à pas les éléments de la perception permettant
la catégorisation à partir de leur synthèse ou unification.
20
Conséquences
• Le problème n’est pas un problème de type cognitif : articuler la vision à la conception.
• Le problème est d’articuler différents niveaux d’interprétation et de constitution du sens.
• Attaquer ce problème à différents niveaux:– Phénoménologie de la perception :
• Distinguer différents niveaux de construction.
– Philologie de l’annotation :• Situer les index.
– Herméneutique de la documentation :• Constituer la catégorie à partir des signes la manifestant ;
– Sémantique de l’indexation :
21
Phénoménologie de la perception
• Le perçu se construit à partir des apparitions et des constituants du signifiant :– Dégager les différents niveaux phénoménologiques
de la constitution du perçu:• Formes;• Contours;• Couleurs;• Etc.
22
Philologie de l’annotation
• L’indexation est interprétation:– Elle propose un interprétant à partir duquel entamer
l’interprétation du signifiant ;– Consigner l’interprétant, c’est annoter le contenu en
vu de sa ré-interprétation.– Les annotations sont des sur-impositions sur le
contenu qui doivent donner pour elles-mêmes leurs propres conditions d’interprétation:
• Situer les points de vue, les auteurs, les condition de production et de réception.
23
Herméneutique documentaire
• Les documents constituent des genres et des collections.– Genres et collections partagent des conditions de
production, réception, répondent à des questions partagées qui permettent de paramétrer (sur-déterminer) l’interprétation.
24
Sémantique de l’indexation
• Les index, pour constituer des concepts distinctifs parmi des paradigmes, doivent être modélisé à travers un code ou système fonctionnel.
• Les outils documentaires classiques doivent être revus à travers une sémantique linguistique différentielle:– Systématicité ;– Description de la variabilité.
25
Conclusion
• L’indexation des documents est d’emblée un problème d’interprétation à tous les niveaux :– Analyse automatique des contenus ;– Indexation interprétative des documentaires ;
• Plutôt que se fonder sur des modèles du monde, il faut articuler les différents niveaux d’interprétation:– Le document comme signe ;– Le percept comme signe ;– L’index comme signe ;