comment intégrer des composants tal open source pour créer un logiciel d'analyse de courriels...
TRANSCRIPT
Comment intégrer des composants TAL open source pour créer un logiciel d'analyse de courriels
Gaëlle Recourcé[email protected]
Gaëlle Recourcé[email protected]
Sylvain [email protected] [email protected]
Kwaga
• décembre 2008• Equipe expérimentée• Partenariat Inria• Brevet « Procédé et système
d’enrichissement de mél »• Le meilleur du mail
Awards
Est-ce que le mail vous prend trop de temps?
(levez la main)
4
Plus de 25% des employés reconnaissent que le nombre
de e-mails qu’ils reçoivent est une cause de retard .
Plus de 25% des employés reconnaissent que le nombre
de e-mails qu’ils reçoivent est une cause de retard .
En moyenne un cadre est interrompu par un media électronique toutes les
10minutes
59% des employés déclarent perdre trop de temps à chercher
des mails égarés
59% des employés déclarent perdre trop de temps à chercher
des mails égarés
71 % des cadres sont stressés par le volume
d’information qu’ils reçoivent dans le cadre
de leur travail
…60% se sentent dépassés…60% se sentent dépassés
Votre assistant personel
Les Besoins
Etude d’usage du mail en entreprise• La volumétrie est connue mais qu'en est-il
qualitativement ? • Projet DLM3.0 – Définition des besoins– Créer des composants qui soient des réponses à un
besoin réel.• APCE – partenaire utilisateur projet– Agence gouvernementale.– Une cinquantaine d'employés.– De nombreux cas d'usage.
• Lettre d'information• Site avec hotline d'aide aux porteurs de projet.• Veille au centre de documentation et chez les juristes.
Quelques paradoxes...• Indispensable mais … – J'adore le mail / pourquoi tant de mails ?
• Faut-il mettre en copie ?– Je ne suis qu'en copie…
• Quel style pour un mail ?– Salut, Cordialement, Bonne journée ?
• Les bonnes résolutions– Ranger sa boite de réception– (Ne pas) regarder sa webmail
• Urgent ou non ? – Pratique ou agressif ?
• Mail contre téléphone
14 14
Fonctionnalités
BirdsEye Notifier
• Signaler les mails importants• Répondre et relancer
Technologie linguistique
Sélection du corps du message
Annotations linguistiques
Date
Date
Invitation Meeting
Interprétation (1)interprétations candidates
Date
Invitation Meeting
Invitation27/10/2009 18:00-
23:59
Invitation27/10/2009 18:00-
23:59
Meeting27/10/2009 18:00-
23:59
Meeting27/10/2009 18:00-
23:59
Interprétation (2)interprétation finale
Date
Invitation Meeting
Invitation27/10/2009 18:00-
23:59
Invitation27/10/2009 18:00-
23:59
Meeting27/10/2009 18:00-
23:59
Meeting27/10/2009 18:00-
23:59
Architecture
23
IAIA LinguistiqueLinguistique
InformatiqueDistribuée
InformatiqueDistribuée
Serveur IMAPServeur IMAP
Serveur KwagaServeur Kwaga AnnotationsAnnotations
Webservice RestWebservice Rest
Kwaga NotifierKwaga NotifierClient MailClient Mail
Serveur Mail
Client Mail
Serveur Kwaga
Normal IMAPinteraction
IMAPget
IMAPflags
JSON
Invoke
JTCL(Sourceforge)
Java
JTCL(Sourceforge)
Java
Unitex(Marne-la-Vallée)
C/C++
Unitex(Marne-la-Vallée)
C/C++
UIMA(Apache)
Java
UIMA(Apache)
Java
Formateur Formateur RMBRMB Analyse linguistique
Analyse linguistique InterprétationInterprétation
UnitexJNI(Ergonotics)C/C++, Java
UnitexJNI(Ergonotics)C/C++, Java
Chaine Kwaga Pulse-UIMA
Open Source
Code propriétaire
Type SystemType System
Open Source Code propriétaire Kwaga
UnitexUnitex
UIMAUIMA
Java wrapperJUnitex
Java wrapperJUnitex
Open Source
AnnotateurUnitexAnnotator
AnnotateurUnitexAnnotator
Type SystemType System