le dicoinfo et le dicoenviro - université de montréal

15
Le DiCoInfo et le DiCoEnviro : deux ressources lexicales pour la terminologie Marie-Claude L’Homme Observatoire de linguistique Sens-Texte (OLST) Université de Montréal 6/17/2010 1 La La « vraie vraie » terminologie (1) terminologie (1) 6/17/2010 2 Informatique matériel logiciel Composante de base périphérique périphérique de saisie périphérique de sortie clavier souris

Upload: others

Post on 18-Jun-2022

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Le DiCoInfo et le DiCoEnviro - Université de Montréal

Le DiCoInfo et le DiCoEnviro : deux ressources lexicales pour la terminologie

Marie-Claude L’HommeObservatoire de linguistique Sens-Texte (OLST)Université de Montréal

6/17/2010 1

La La «« vraie vraie »» terminologie (1)terminologie (1)

6/17/2010 2

Informatique

matériel logiciel

Composante de base périphérique

périphérique de saisiepériphérique de sortie

claviersouris

Page 2: Le DiCoInfo et le DiCoEnviro - Université de Montréal

La La «« vraie vraie »» terminologie (2)terminologie (2)Terme envisagé comme étiquette d’un concept; ce dernier faisant partie d’un système conceptuelDéfinition « normée » ou consensuelle axée sur celle des spécialistes;Relations privilégiées : synonymie ou variation terminologique (ex. souris – souris informatique) hyperonymie-hyponymie (ex. souris –périphérique de saisie); méronymie (ex. souris –bouton, molette)

La La «« vraie vraie »» terminologie (3)terminologie (3)

Terme envisagé comme étiquette d’un concept; ce dernier faisait partie d’un système conceptuel◦ Le concept est défini en fonction de la place

qu’il occupe dans ce système conceptuel, c’est-à-dire des liens qu’il partage avec d’autres concepts◦ Le système conceptuel est élaboré en

fonction de critères très stricts sur lesquels les spécialistes se sont entendus

Page 3: Le DiCoInfo et le DiCoEnviro - Université de Montréal

La La «« vraie vraie »» terminologie (4)terminologie (4)

La La «« nôtre nôtre »» de terminologie (1)de terminologie (1)

6/17/2010 6

souris

périphérique

utilisateur

pointeur

~ sans fil

~ à fil rétractable

clavier

icône

déplacer une ~

faire glisser une ~

cliquer sur …avec une ~

~ ergonomique

~ optique

~ mécanique

brancher une ~ à …

Page 4: Le DiCoInfo et le DiCoEnviro - Université de Montréal

La La «« nôtre nôtre »» de terminologie (2)de terminologie (2)

6/17/2010 7

périphérique

matérielunité centrale

~ maître ~esclave~ sans fil

clavier imprimante écran

Installer un ~ brancher un ~ à …

détecter un ~ordinateur

utilisateuraccepter un ~reconnaître un

~

La La «« nôtre nôtre »» de terminologie (4)de terminologie (4)

Page 5: Le DiCoInfo et le DiCoEnviro - Université de Montréal

La La «« nôtre nôtre »» de terminologie (5)de terminologie (5)

Les questions ayant menLes questions ayant menéé àà ce ce travailtravail

Intégration des collocations dans les ouvrages de référence terminologiques (plus particulièrement, les collocatifsverbaux)Programme : écrire un ~, données (traiter des ~)Pourquoi ne pas considérer que les verbes peuvent faire l’objet d’un article à part entière (pas courant dans les ouvrages de référence terminologiques)écrire: Qqn (un programmeur) ~ qqch (un programme) en qqch ( un

langage spécifique)Le fait de prendre en compte les verbes soulève le problème de tenir compte du comportement syntaxique des termes (encore une fois, peu courant dans les ouvrages de référence terminologiques)

écrire: Qqn écrire un programme, qqn écrire un programme en C++, programme écrit en Java, etc.

Inclure des termes appartenant à diverses parties du discours 6/17/2010 10

Page 6: Le DiCoInfo et le DiCoEnviro - Université de Montréal

DD’’autres questionsautres questionsPolysémieÉcrire1: un lecteur ~ des données sur un disqueÉcrire2: un programmeur ~ un programme dans un langage

spécifique

Prise en compte de relations entre termesÉcrire1: Contrastif lire; Sens voisin accéder, graverÉcrire2 : Quasi-synonyme programmer; Sens voisin developperProgrammer: Noun programmation; agent typique

programmeur; résultat programme

Étendre le nombre de relations décrites en terminologie

6/17/2010 Cenlex, Aarhus Universitet 11

Les termes que nous dLes termes que nous déécrivonscrivons

Noms, verbes, adjectifs et adverbes◦ info : données, logiciel, installation, cliquer, virtuel, convivial, dynamiquement◦ enviro : biosphère, changement, réchauffer, atmosphérique

Prise en compte de termes complexes si leur sens n’est pas compositionnel (définition d’”unité lexicale” s’appuyant sur Cruse 1986)◦ info : traitement de texte, système d’exploitation◦ enviro : effet de serre

Prise en compte de distinctions sémantiques fines◦ info : courriel 1 (je viens d’envoyer un courriel); courriel 2 (j’ai fini de lire

mon courriel)◦ Enviro : réchauffer 1a (le climet se réchauffe); réchauffer 1b (les gaz à

effet de serre réchauffent le climat)Prise en compte de nombreux liens lexicaux◦ Paradigmatiques : synonymie, hyperonymie, dérivation syntaxique◦ Syntagmatiques : collocations

6/17/2010 12

Page 7: Le DiCoInfo et le DiCoEnviro - Université de Montréal

Les descriptions que nous Les descriptions que nous proposonsproposons

Base de données◦ Dans le domaine de l’informatique et de l’Internet◦ Dans le domaine de l’environnement◦ Français (plus grande couverture) : extension à l’anglais et à l’espagnol

Décrire les termes appartenant à diverses parties du discoursFournir une description de la structure lexicale des terminologiques (structure argumentale, polysémie, relations lexicalesFournir de l’information explicite et détaillé sur le fonctionnement des termes : propriétés syntaxico-sémantiques et de combinatoire

6/17/2010 Cenlex, Aarhus Universitet 13

Cadres thCadres thééoriquesoriques

Deux cadres théoriques menant à la conception de bases de données lexicales

Lexicologie explicative et combinatoire (LEC) (Mel’cuk et al. 1984-1999; 1995) -> Dictionnaireexplicatif et combinatoire (ECD), DiCo, Dicouèbe

Structure argumentale (structure actancielle, formepropositionnelle), liens lexicaux

Frames Sémantiques (Fillmore 1977, 1982) -> FrameNet

Structure argumentale (énumération des core frame elements et prise en compte des non-core frame elements) et annotation contextuelle

6/17/2010 Cenlex, Aarhus Universitet 14

Page 8: Le DiCoInfo et le DiCoEnviro - Université de Montréal

MMééthodologiethodologieÉlaboration du corpusSélection des termesÉtablissement de distinctions sémantiquesCollecte de contextesDéfinition de la structure argumentaleÉlaboration de listes de liens lexicauxAutres : rédaction de la définition, information complémentaireÉtablissement de liens d’équivalence

Applications informatiques utilisées : concordanciers (Intercorpus), extracteurs de termes (TermoStat, Drouin), etc.

Rédaction des articles se fait dans un formalisme XML (versions antérieures : collaboration avec G. Lapalme; version actuelle : Benoît Robichaud)

Mise au point de traitements informatiques en collaboration avec des collègues informaticiens (Claveau, Lapalme, Hadouche)

6/17/2010 Cenlex, Aarhus Universitet 15

OverviewOverview of the of the methodologymethodology

6/17/2010 Cenlex, Aarhus Universitet 16

Page 9: Le DiCoInfo et le DiCoEnviro - Université de Montréal

Les articles (1)

Les articles (2)

Page 10: Le DiCoInfo et le DiCoEnviro - Université de Montréal

Les articles (3)

Les articles (4)

Page 11: Le DiCoInfo et le DiCoEnviro - Université de Montréal

Les articles (5)

Les articles (6)

Page 12: Le DiCoInfo et le DiCoEnviro - Université de Montréal

La navigation (1)

La navigation (2)

Page 13: Le DiCoInfo et le DiCoEnviro - Université de Montréal

Fonctions de recherche (1)

Fonctions de recherche (2)

Page 14: Le DiCoInfo et le DiCoEnviro - Université de Montréal

Fonctions de recherche (3)

Travail actuel et Travail actuel et àà venirvenirEnrichissement des bases françaises◦ DiCoInfo-fr : 1000 articles et plus de 20 000 liens lexicaux◦ DiCoEnviro-fr : env. 100 articlesEnrichissement des bases anglaises et espagnols◦ DiCoInfo-en : env. 400 articles◦ DiCoInfo-es : env. 20 articlesCréation de nouvelles bases ◦ JuriDiCo : portugais et anglais◦ DiCoCera : espagnolAnnotations contextuelles en français, anglais et espagnolPrésentation et accès aux données◦ Accès au collocations◦ Parcours dans le vocabulaire spécialisé

6/17/2010 Cenlex, Aarhus Universitet 28

Page 15: Le DiCoInfo et le DiCoEnviro - Université de Montréal

RRééfféérencesrencesCruse, D.A. 1986. Lexical Semantics. Cambridge: Cambridge University Press.Fillmore, C.J. 1968. The case for case, In Bach, E. and R.T. Harms (eds.). Universals in Linguistic Theory, New

York: Holt, Rinehard and Winston, 1-88.Fillmore, C.J. 1977: Scenes-and-frames semantics, Linguistic Structures Processing. In Zampolli, Antonio

(ed.). Fundamental Studies in Computer Science, No. 59, North Holland Publishing, 55-88.Fillmore, C.J. 1982. Frame Semantics. In The Linguistic Society of Korea (ed.). Linguistics in the Morning Calm.

Seoul: Hanshin, 111-137.Fillmore, C.J. & B.T.S. Atkins. 1992. Towards a Frame-based Organization of the Lexicon: The Semantics of

RISK and its Neighbors. In Lerher, A. & E. Kittay (eds.). Frames, Fields and Contrast. New Essays in Semantics and Lexical Organization. Hillsdale: Lawrence Erlbaum, 75-102.

L'Homme, M.C. 2007. Using Explanatory and Combinatorial Lexicology to Describe Terms. In Wanner. L. (ed.). Selected Lexical and Grammatical Topics in the Meaning-Text Theory. In Honour of Igor Mel'cuk, Amsterdam/Philadelphia: John Benjamins.

L’Homme, M.C. (dir). 2008. DiCoInfo. Dictionnaire fondamental de l’informatique et de l’Internet (http://olst.ling.umontreal.ca/dicoinfo/) Accessed 1April 2009.

L’Homme, M.C. and H.S. Bae 2006. A Methodology for Developing Multilingual Resources for Terminology.. In LREC 2006. Language Resources and Evaluation. Proceedings, Genoa (Italy), 22-27 May 2006

Mel’čuk et al., I. 1984-1999. Dictionnaire explicatif et combinatoire du français contemporain. Montréal: Presses de l’Université de Montréal.

Mel’čuk, I., Clas, A. and Polguère, A. 1995. Introduction à la lexicologie explicative et combinatoire, Louvain-la-Neuve (Belgique) : Duculot / Aupelf - UREF.

Ruppenhofer, J., M. Ellsworth, R.L.M. Petruck, C. Johnson and J. Scheffczyk. 2006. FrameNet II: ExtendedTheory and Practice (http://framenet.icsi.berkeley.edu/index.php?option=com_wrapper&Itemid=126). Accessed 12 September 2008.

6/17/2010 Cenlex, Aarhus Universitet 29