zone présenté au concours boostyourcode
Post on 20-Jul-2015
237 Views
Preview:
TRANSCRIPT
Ze Ontology News Extractor
Celui qui contrôle les données contrôle le web
Pour le concours BoostYourCode 2012
Christophe DESCLAUX
CONTEXTE ZONE(UR) BoostMyZone !
2
Christophe Desclaux
CONTEXTE
Ingénieur Informatique
Knowledge Information Systems
CONTEXTE ZONE(UR) BoostMyZone !
3
Mes engagements
Aide à la mise en place de serveurs
Animation de conférences
vice président
Organisation des « Journées Méditerranéennes du Logiciel Libre » depuis 2009
CONTEXTE
CONTEXTE ZONE(UR) BoostMyZone !
4
CONTEXTE
Cas d'utilisation
Que se passe-t-il dans l'écosystème de la fondation Apache en ce moment ?
CONTEXTE ZONE(UR) BoostMyZone !
5
Problématique
Agrégation d'informations
Regroupement par catégories
Recherche d'informations efficace
CONTEXTE
CONTEXTE ZONE(UR) BoostMyZone !
6
Les solutions existantes CONTEXTE
Mémoire de
lectures
installablelibre
Agrégation de
flux RSS
CONTEXTE ZONE(UR) BoostMyZone !
7
Les flux RSS
Contenu produit automatiquement
Sites d'actualité / blogs
Dialecte XML
CONTEXTE
CONTEXTE ZONE(UR) BoostMyZone !
8
Les solutions existantes CONTEXTE
Multiplicité des
sources
Sémantique
.FR
CONTEXTE ZONE(UR) BoostMyZone !
9
Web sémantique
Contenus accessibles aux ordinateurs
Sources interconnectés
Des vocabulaires partagés
CONTEXTE ZONE(UR) BoostMyZone !
10
Les solutions existantes CONTEXTE
Sémantique
Regroupement
GratuitMultiplatefor
meMultiplicité
des sources
CONTEXTE ZONE(UR) BoostMyZone !
14
Gratuit
Recherchemulti-critères
Mémoire delecture
Libre
Installable
Regroupement
Multi-plateforme
Multiplicitédes sources
Sémantique
CONTEXTE
CONTEXTE ZONE(UR) BoostMyZone !
15
Ze Ontology News Extractor
Présentation du prototype
ZONE(UR) CONTEXTE
CONTEXTE ZONE(UR) BoostMyZone !
18
Lecteurde flux
Flux RSS
Flux
Annotateur
WikiMeta
Organisations
Personnalités
Objets
GeoMeta
OpenCalais
INSEE Geo
Annotation des flux
Entrée : texte de la news
Sortie : annotations
News
ZONE(UR) CONTEXTE
CONTEXTE ZONE(UR) BoostMyZone !
19
Stockage des
Flux annotésBDD
Flux RSS
Item annoté
Flux Items annotés
News
ZONE(UR) CONTEXTE
Lecteurde flux
AnnotateurAnnotateur
CONTEXTE ZONE(UR) BoostMyZone !
20
Stockage des
Flux annotésBDD
Flux RSS
Item annoté
Flux Items annotés
ZONE
Serveur d'annotation sémantique
News
ZONE(UR) CONTEXTE
Lecteurde flux
AnnotateurAnnotateur
CONTEXTE ZONE(UR) BoostMyZone !
21
besoinutilisa
teur
ZONE(UR) CONTEXTE
Evenements ville Montpellier
CONTEXTE ZONE(UR) BoostMyZone !
22
critèresÉlément deconfiguratio
nbesoin
utilisateur
ZONE(UR) CONTEXTE
Evenements ville Montpellier
CONTEXTE ZONE(UR) BoostMyZone !
23
critèresÉlément deconfiguratio
nbesoin
utilisateur
Créationrequête
ZONE(UR) CONTEXTE
CONTEXTE ZONE(UR) BoostMyZone !
24
BDD
critèresÉlément deconfiguratio
nbesoin
utilisateur
RéponseCréationrequête
Requête
ZONE(UR) CONTEXTE
CONTEXTE ZONE(UR) BoostMyZone !
25
BDD
critères
Flux RSS
Élément deconfiguratio
nbesoin
utilisateur Transformatio
n
RéponseCréationrequête
ZONE(UR) CONTEXTE
Requête
CONTEXTE ZONE(UR) BoostMyZone !
26
Clients possibles :
Smartphone
Interface WEB
Plugins
BDD
critères
Flux RSS
Élément deconfiguratio
nbesoin
utilisateur Transformatio
n
RéponseCréationrequête
ZONE(UR) CONTEXTE
ZONEUR Requête
CONTEXTE ZONE(UR) BoostMyZone !
27
Stockage des
Flux annotésBDD
critères
Flux RSS
Flux RSS
Élément deconfiguratio
nbesoin
Item annoté
Flux Items annotés
Annotateur
ZONEUR
utilisateur Transformatio
n
RéponseCréationrequête
ZONE
News
ZONE(UR) CONTEXTE
Lecteurde flux
AnnotateurAnnotateur
Requête
CONTEXTE ZONE(UR) BoostMyZone !
28
État actuel du prototype
Etude du web sémantique
Démarche d'architecture logicielle
Diffusion à la communauté scientifiqueCIEL 2012 : Conférence en IngénieriE du Logiciel
ZONE(UR) CONTEXTE
Proof of concept : http://zone.zouig.orgCode : http://github.com/descl/ZONE
CONTEXTE ZONE(UR) BoostMyZone !
29
Apports communautaires
Publication API Java
Correction de bugs
ZONE(UR) CONTEXTE
Corese
CONTEXTE ZONE(UR) BoostMyZone !
36
BoostMyZONE
Permettez moi de concrétiser mon projet !
BoostMyZone ZONE(UR)
CONTEXTE
CONTEXTE ZONE(UR) BoostMyZone !
38
Choix de la licence
Serveur : licence GPL v3
Classique
Connue et reconnue
Compatible avec la licence Apache
Client : licence AGPL
Moins permissive
Prise en compte de la distribution sous forme de service
BoostMyZone ZONE(UR)
CONTEXTE
CONTEXTE ZONE(UR) BoostMyZone !
39
OrganisationWP1 : la communauté
Présentation au public
Appels à contributions
WP2 : le serveur d'annotation
Passage à l'échelle
Ajout de services d'annotations
Data clustering
WP3 : les clients
Amélioration visuelle
Client android
BoostMyZone ZONE(UR)
CONTEXTE
CONTEXTE ZONE(UR) BoostMyZone !
40
Pourquoi me financer ?
CO
N
C
L
U
S
IO
N
BoostMyZone ZONE(UR)
CONTEXTE
ZONE(UR) CONTEXTE
CONTEXTE ZONE(UR) BoostMyZone !
41
Merci de votre attention
“J’ai un double rêve pour le Web. D’une part, je le vois devenir un moyen très puissant de coopération entre les êtres humains. Et dans un second temps, j’aimerais que ce soit les ordinateurs qui coopèrent. Quand mon rêve sera réalisé, le Web sera un univers où la fantaisie de l’être humain et la logique de la machine pourront coexister pour former un mélange idéal et puissant.” Tim Berners-Lee
CO
N
C
L
U
S
IO
N
BoostMyZone ZONE(UR)
CONTEXTE
ZONE(UR) CONTEXTE
Merci à Mireille Blay-Fornarino, Christian Brel, Luc Champalle, Patrice Deschaux, Catherine Faron-Zucker, Amélie Gyrard, Romaric Pighetti, Matti Schenider et Simon Urli pour leur aide précieuse
Planning prototype
Octobre / Novembre : découverte du sujet, étude bibliographique et recherche de solutions existantes
Plein temps décembre (2s) : Étude des différents services d'annotation possibles , tests poussés des solutions et rédaction de tests unitaires pour vérifier les problèmes de régression
Janvier : Construction du workflow d'annotation
Février : Spécification concernant la première version du service de filtrage
Plein temps Mars (2s) : Finalisation du service de filtrage et rédaction de l'article scientifique
Valorisation commerciale
Les entreprises on besoin d'installer ce genre d'application sur leurs machine
Fournir des solutions de consulting pour projets de pilotage
Ajout de nouveaux services d'annotation dictés par les besoins d'entreprises
CONTEXTE ZONE(UR) BoostMyZone !
45
Apports communautaires
Projet WikiMeta (annotateur)
Publication API Java
Correction de bugsProjet 4Store (serveur RDF)
Rapport de bugs concernant la suppression d'informations par requêtes Sparql
Projet Corese (Moteur SPARQL)
Rapport de bug concernant des problèmes de performance sur de grands jeux de données
Librairie 4store-ruby
Fork de l'application pour permettre des requêtes
ZONE(UR) CONTEXTE
CONTEXTE ZONE(UR) BoostMyZone !
46
Aspects juridiques
Droit d'auteurs
Droit de citation
Respect de la vie privée
Rester hébergeur et non éditeur de contenu
T12T10T8T6T4T2T0T-2
Communauté
Serveur
Client
Présentation au public
Diffusion prototype
Compilation des retours
Appel à contribution
Gestion d'un grand nombre de flux
Ajout de services d'annotation
Agrégation des news similaires
Amélioration visuelle du client web
Doc sur la création de clients
Création d'autres clients
Fourniture d'un client final
Planning
top related