accès aux textes, mutation des usages et des techniques p-j. benghozi et r. teulier pole de...
Post on 03-Apr-2015
104 Views
Preview:
TRANSCRIPT
Accès aux textes, mutation des usages et des techniques
P-J. Benghozi et R. TeulierPole de recherche en économie et gestion de l’Ecole polytechnique
UMR CNRS 7176
J. CharletIngénierie des connaissances des systèmes de santé
INSERM ERM 202 UFR Broussais
D. BourigaultÉquipe de recherche en syntaxe et sémantique
UMR CNRS Université Toulouse Le Mirail
PI TCAN 2004
2
Les enjeux de la recherche• Moyen d’accès et gestion des grands corpus
– Consultation, appropriation, amélioration des usages– Découpage, identification, frontière, accès au contenu du document. Évaluations
d’ingénierie non disponibles
• Appréhension des usages– Situations d’usages différenciés
• Organisations et contextes de consultations• Profils d’usagers
• Ingénierie et conception d’outils– Conjonction d’outils terminologiques et NTIC– Enchaînement d’étapes de développement reproductibles
• Structures de diffusion des publications.– Modèles économiques soutenables– Évolution des usages et des “métiers” associés
3
Une équipe• Qui mobilise des compétences pluridisciplinaires
– Lexicales et terminologiques• Outils d’indexation automatiques de corpus• Interfaces de navigation
– Informatique et ingénierie des connaissances• Constructions d’index• outils de consultation
– Économiques et de gestion• Analyses socio-technique• Chaînes de valeur et analyse d’usage
• Aux collaborations industrielles éprouvées– Partenariats– Situations réelles d’usage
4
La démarche
• Des étapes en terminologie et ingénierie des connaissances– modèles conceptuels des accès, indexations et utilisations
des grands corpus• En s’appuyant sur Sitesearch pour explorer des contextes variés
• Explorer les configurations d’usage associées en matière éditoriale (revues scientifiques et ouvrages)– savoir faire des métiers éditoriaux, chaînes de valeur de
production, situations d’usage (en situation ou à distance, assisté ou non…)
• Un retour sur le développement d’outils
5
Expérimentation Revel : analyse d’un portail de revue
• Portail de revues SHS de l’ Université de Nice• Tester des nouvelles technologies de navigation
– SiteSearch : micro index autour des requêtes utilisateurs– SearchIndex : index général et carte du contenu
• Constats et limites à partir d’une observation approfondie
• Une taille et un corpus limité adaptés à une phase exploratoire• Une échelle peu adaptée à une étude approfondie
– Peu de concurrence entre les revues rend la recherche peu pertinente – Faibles corpus
6
Travail individuel des chercheurs SHS : consultation et écriture d’article
• Une double activité : lecture et production
• Un travail individuel dans un cadre collectif
• Un focus sur la consultation des revues en ligne et la recherche bibliographique– Browsing ou Searching ?– Des typologies d’utilisateurs– Des observations confirmant les résultats de la
littérature
7
Les modes d’accès des lecteurs
• Quatre points d’entrée pour trouver les articles :– auteurs / revues / plateformes / référencement web.
• 4 stratégies et pratiques possibles– suivre directement certains auteurs– sélectionner les papiers de revues qu’ils connaissent– choisir à l’intérieur de la base extensive proposée par
une plateforme– chercher des papiers à l’aveugle via des moteurs de
recherche
• Correspondant à des structurations différentes des réseaux et communautés de connaissance
8
Articuler ingénierie des outils et socioéconomie des usages
• Une articulation qui s’opère selon deux axes– Accès individuel aux textes
• Décryptage des pratiques• Poser les base de son appropriation
– dans la conception des outils– Dans l’amélioration de leur interface
– Accès collectif aux textes• Modélisation des pratiques de production de textes et de
sélection des revues• Intégration de cette modélisation dans le cadre de la
conception d’outils
9
Conséquences sur la structuration des outils
• Localisation des moteurs– Utilisateurs / web / plateforme / revues
• Fonctionnalités– Repérage / accès aux textes / accès à des corpus proches /
accès à des réseaux d’auteurs
• Modèle économique des outils– Faire payer la prestation d’information
• Corpus référencé– Articles citables / working papers / ouvrages
• Contrer les stratégies d’anticipation des auteurs• Monopoles, externalités de réseau et effet podium
10
Conceptualisation des cadres socio-économiques
• Un modèle à 5 couches– Auteurs– Editeurs de revues– Plateformes agrégatives (Jstor, Revel)– Moteurs de recherche– Lecteurs
• Une plus value de prescription de 4 ordres– sélection d’articles (travail éditorial + referees)– Accompagnement et modification d’un projet initial– Choisir, éditer et diffuser des articles dans une thématique – Fournir un support de repérage d’articles
• Différentes fonctions – prises en charge et rémunérées par des acteurs différents– relevant, pour l’instant, des seuls éditeurs scientifiques
11
Les modèles économiques de la diffusion de contenus numériques
• Des modèles d’affaires qui influencent les usages– Facturation, structuration des contenus…
• Des pôles différents de configurations– Autour de l’organisation des contenus– Autour de la maîtrise des plateformes– Autour de la valorisation d’une technologie– Autour du contrôle d’accès à une infrastructure
• Des évolutions qui pèseront sur les pratiques– Revues et textes en accès libre– Limitation des corpus de recherche– Rôle des intermédiaires et prescripteurs
12
Travail collectif des chercheurs SHS : la production de revue
• Analyse des fonctionnements de comités éditoriaux– Analyse en situation– Le point de vue des éditeurs et rédacteurs en chef
• Modélisation des processus– Repérage des procédures et routines
• Le Peer Review Process• La composition du numéro• La gestion d’un stock d’articles
– Méthodes d’ingénierie des connaissances (KADS)
13
Tests de fonctionnalités de boites à outils du portail de revues
• Expérimentation d’usages
• Indexation des articles d’une revue par les éditeurs de la revue suivie– Aspiration d’un corpus– Indexation automatique d’un corpus– Validation par les rédacteurs d’une revue
14
Affecter un rapporteur
Affecter des relecteurs
Synthétiser les relecteurs, présenter au comité
Prendre une décision retour à l’auteur
Evaluer la qualité des modifications faites
Le processus de relecture
15
16
Activité commune à chaque étape qui fait le passage entre l’analyse individuelle et la validation collective :
- rédacteur pour affecter un rapporteur
- rapporteur pour proposer relecteurs- rédacteur pour transmettre les
relectures et l’évaluation des modifs
Pouvoir naviguer dans les textes, article, notes, plan et annotations avec un impératif de lisibilité et de rapidité.
Transmettre sa lecture personnelle : l’analyse individuelle base de l’activité collective
17
L’assistance au travail des comités éditoriaux en présentiel
• Affichages des documents et annotations• Les fonctionnalités retenues
– Affichage en mode plan – Commentaires et annotations– Outil linguistique et désignation des relecteurs
• Composition du numéro• Gestion du stock de textes par tableaux
glissants
18
Répertoire partagé de toutes les versionsdes textes, courriers etc …
Un site communpour le travail hors comité
Des connexions à distancepour les réunions du comité
Des utilitaires d’échangeentre les membres du comité
forums, agenda, composition des ordres du jour, etc
Une maquette de site internet collaboratif
19
Le traitement des annotations
• Les annotations sont des objets organisés, maintenus, et diffusés pour aider à la création de la lisibilité au sein du processus de décision
• Des objets aussi importants si ce n’est plus que le document lui-même
• Des annotations des relecteurs• Des annotations du comité éditorial surchargeant
les précédentes pour les confirmer ou les infirmer
• Un typage des ces annotations permettant de sélectionner chaque intervenant (relecteur vs comité éditorial)
20
21
L’assistance au choix des referees
• Les principes retenus : – disposer du « profil terminologique » de chacun des
relecteurs potentiels– Etablir pour chaque article soumis :
• Indexation– extraire automatiquement un ensemble de descripteurs
• Appariement– comparer la liste des descripteurs avec les profils relecteurs
• Choix– choisir les relecteurs les plus « proches »
22
Indexation des articles
• Extraction des candidats-termes de l’article– avec l’analyseur SYNTEX
• Sélection des candidats-termes les plus « pertinents » – à l’aide de différents indices :
• tf-idf
• Présence dans le résumé ou les titres
• Appartenance à un thesaurus
• …
23
Construction des profils terminologiques
• Génération automatique :– On dispose d’une base d’environ 200 articles de la
revue
– Pour chaque article, on connaît les noms des relecteurson peut calculer pour chaque relecteur un profil
terminologique- à partir des descripteurs des articles qu’il a relu
- si un relecteur est auteur, on prend en compte aussi les descripteurs de ses propres articles)
- Validation des profils avec les rédacteurs
24
Perspectives et évolutions de la recherche
• Articulation des trois logiques structurantes– Pratiques d’usages– Développements d’outils– Modèles économiques soutenables
• Mise en œuvre et structuration dans un cadre international– Projet Econtent Plus
25
Merci de votre attention
26
27
La composition du numéro
Une re composition permanente et glissante
Etalée sur plusieurs mois, qui se remet en cause jusqu’à la dernière réunion avant l’envoi à l’imprimeur
Visualisation sous forme de tableaux déjà avancée.
28
29
Les processus fondamentaux
I. Le processus de relecture
II. la gestion du stock
III. La composition du numéro
30
Globalement quelle activité ?
Il s’agit de gérer un stock d’articles qui passent au cours du temps par des états très différents :- de projet d’article à projet confirmé, V1, V1 affectée,V1 relue, V1renvoyée, V2, V2 relue… Vprêt à tirer… - à article V PàT –1 inscrit dans un projet 1 de sommaire, puis projet 2… jusqu’à article envoyé chez l’imprimeur, article paru, article archivé
Sous l’action individuelle et collective de personnes du comité et hors du comité.
Qu’il faut coordonner
31
Les processus qu’il s’agit d’assister
Le texte comme élément de base du travail et une absence quasi générale du texte remplacée par une activité de discours sur le texte. Deux directions pour assister :
- l’annotation, commentaire- la note de lecture- la circulation sur le texte
Il s’agit essentiellement de conversations sur les textes, les assister c’est ajouter de la visualisation.
32
Les questions :autour de la relecture
Le temps de discussion autour d’un article varie d’environ ¼ heure à ¾ heure : de quelle nature sont les problèmes qui font la différence ? Y a –t-il matière à assistance ?
L’évaluation des modifs ? Qui évalue la V2 ? Est-ce que le problème d’évaluation des modifs peut être assisté ? Est-ec que le rapporteur peut repartir des textes annotés par les relecteurs ?
33
Un numéro de revue comme un tout indivisible (dossier)
Une cohérence éditorialeUn équilibre interne pour satisfaire le lectorat
Une revue numérique publiant instantanément les articles retenus
Un numéro thématique de revueMise en avant d’une seule thématique
La satisfaction d’une seule partie du lectorat (équilibre dans la succession des numéros thématiques)
La recherche d’une cohérence dans l’offre remise en cause et reconstruite par le numérique
34
Les questions : gestion du stock et composition du numero
Supportée par un tableau 7 colonnes. Il fait état d’une seule des entrées possibles : à partir du statut de chaque objet (article, éditorial, revue de livre, débat etc ). - entrée complémentaire par la composition progressive des numéros futurs ?
Deux tableaux à faire progresser au fur et à mesure des décisions en séance, ce que le papier et annotations individuelles ne permettent pas.
Evolution des tableaux par glissements d’intitulés dans des colonnes et enregistrements simultanés sur plusieurs feuilles.
35
Les questions :autour de l’indexation
L’indexation peut être faite par différents acteurs :auteur, revue, site
L’indexation auteur est à conserver parce qu’elle renseigne sur les opinions de l’auteur, mais elle est mauvaise pour retrouver l’article.
Composer une indexation est un travail de fond qui ajoute à la richesse du corpus.
Une possibilité d’outil à partir de l’indexation : la pré-affectation des noueavux articles à des relecteurs et rapporteurs.
36
Réunion du comité éditorial• Un travail collaboratif autour de documents
peu ou pas instrumenté : au mieux une vidéo-projection
• Une nécessité d’outils de collaboration pour installer une lisibilité partagée des articles relus
Proposer des annotations pour instaurer cette lisibilité partagée
37
TYPES OF USE Enthused
REGULAR USE
Topic-focused Binge Journal-
focused
Explorers Article-window-shoppers focused
CURTAILED USE
SuperJournal: A User Model
5–10
3
1
0
USER TASKS
• Keeping up to date with articles in spec areas• Keeping up to date with broader developments• Gathering background information for a new area of work
• Preparing for specific events: grant proposal, presentation, etc.
• Performing tasks associated with teaching
MEDIATINGFACTORS
Discipline ofuser
Competingservicesavailable touser
Personaljournal habits& preferences
NO
. OF
RE
LE
VA
NT
JO
UR
NA
LS
38
SuperJournal: Future User RequirementsTop Ranked Electronic Journal Service Requirements
1. Wide range of journals2. Up to date3. Fast access4. Easy to use5. Good backfile6. Searchable titles and abstracts7. Good-quality print outs8. Good-quality on-screen presentation9. Available anytime, anywhere, 24/710. Ability to search full text11. Alerts when new issues/articles published12. Linking to other electronic services/articles
39
Outil d’assistance à l’animation scientifique d’une revue
• Une étude d’usage et des observations sur une longue période.
• Un essai : une maquette d’assistance au travail collectif :- comités de lecture : sélection d’article (interface d’analyse collective d’un texte et outil « profil du relecteur »)
- comité de rédaction = prod.éditoriale (outil de gestion collective d’un stock et de répartition des taches)
40
Publishing Chain d’après TENOPIR
Reader AuthorLi
bra
ry
Consorti
a
Indexer
Vendo
r
Publis
he
r
Editor
41
Number of Subscribers
Cost/print subscription
E-savings
500
5,000
10,000
50,000
$993
$140
$93
$55
11%
37%
52%
84%
The Minimum price necessary to recover costs at various levels of circulation
top related