datalift at semwebpro
Post on 01-Dec-2014
3.139 Views
Preview:
DESCRIPTION
TRANSCRIPT
SemWebPro 18012011 1
Publier des donneacutees lieacutees sur le WebTutoriel Datalift
Bernard Point ndash Atos Originbernardpointatosorigincom
Franccedilois Scharffe ndash LIRMMCNRSfrancoisscharffeinriafr
Raphaeumll Troncy ndash Eurecomraphaeltroncyeurecomfr
Bernard Vatant ndash Mondecabernardvatantmondecacom
Avec laide de leacutequipe de Dataliftet le soutien de lAgence Nationale de la Recherche
SemWebPro 18012011 2
Sommaire
1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)
SemWebPro 18012011 31 Introduction
SemWebPro 18012011 4
Datalift
Une expeacuterimentation agrave grande eacutechelle de la publication de donneacutees sur le Web
Objectifs - Publier des donneacutees de reacutefeacuterence - Automatiser le processus de
publication - Deacutemontrer linteacuterecirct de publier ses
donneacutees
SemWebPro 18012011 5
Datalift
Deux pheacutenomegravenes Socieacutetal ndash louverture des donneacutees Technique ndash le web seacutemantique
La reacutevolution des donneacutees est en marche Le web de donneacutees explose comme le web de documents a exploseacute agrave la fin des anneacutees 90
SemWebPro 18012011 6
Datalift
Activiteacutes Publication de jeux de donneacutees Recherche de nouvelles techniques et formalismes
pour ameacuteliorer et automatiser la publication Deacuteveloppement dune architecture modulaire
permettant dinteacutegrer des outils daide agrave la publication Organisation deacutevegravenements autour de la publication
sur le web de donneacutees
SemWebPro 18012011 7
Datalift
Partenaires
Processus de publication
SemWebPro 18012011 8
Processus de publication
SemWebPro 18012011 9
SemWebPro 18012011 10
Sommaire
1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)
SemWebPro 18012011 112 Seacutelection
SemWebPro 18012011 12
Les vocabulaires de mes amis hellip
Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees
Critegraveres drsquoutilisabiliteacute
Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip
Diffeacuterents types de vocabulaires
De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip
Les piliers du Linked Data Dublin Core FOAF SKOS
Bonnes et moins bonnes pratiques
Ex Programmes BBC vs legislationgovuk
Vocabulary of a Friend les vocabulaires en reacuteseau
Problegravemes linguistiques
Les vocabulaires existants sont en anglais agrave 99
Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo
SemWebPro 18012011 13
Vous avez dit laquo vocabulaire raquo
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 2
Sommaire
1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)
SemWebPro 18012011 31 Introduction
SemWebPro 18012011 4
Datalift
Une expeacuterimentation agrave grande eacutechelle de la publication de donneacutees sur le Web
Objectifs - Publier des donneacutees de reacutefeacuterence - Automatiser le processus de
publication - Deacutemontrer linteacuterecirct de publier ses
donneacutees
SemWebPro 18012011 5
Datalift
Deux pheacutenomegravenes Socieacutetal ndash louverture des donneacutees Technique ndash le web seacutemantique
La reacutevolution des donneacutees est en marche Le web de donneacutees explose comme le web de documents a exploseacute agrave la fin des anneacutees 90
SemWebPro 18012011 6
Datalift
Activiteacutes Publication de jeux de donneacutees Recherche de nouvelles techniques et formalismes
pour ameacuteliorer et automatiser la publication Deacuteveloppement dune architecture modulaire
permettant dinteacutegrer des outils daide agrave la publication Organisation deacutevegravenements autour de la publication
sur le web de donneacutees
SemWebPro 18012011 7
Datalift
Partenaires
Processus de publication
SemWebPro 18012011 8
Processus de publication
SemWebPro 18012011 9
SemWebPro 18012011 10
Sommaire
1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)
SemWebPro 18012011 112 Seacutelection
SemWebPro 18012011 12
Les vocabulaires de mes amis hellip
Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees
Critegraveres drsquoutilisabiliteacute
Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip
Diffeacuterents types de vocabulaires
De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip
Les piliers du Linked Data Dublin Core FOAF SKOS
Bonnes et moins bonnes pratiques
Ex Programmes BBC vs legislationgovuk
Vocabulary of a Friend les vocabulaires en reacuteseau
Problegravemes linguistiques
Les vocabulaires existants sont en anglais agrave 99
Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo
SemWebPro 18012011 13
Vous avez dit laquo vocabulaire raquo
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 31 Introduction
SemWebPro 18012011 4
Datalift
Une expeacuterimentation agrave grande eacutechelle de la publication de donneacutees sur le Web
Objectifs - Publier des donneacutees de reacutefeacuterence - Automatiser le processus de
publication - Deacutemontrer linteacuterecirct de publier ses
donneacutees
SemWebPro 18012011 5
Datalift
Deux pheacutenomegravenes Socieacutetal ndash louverture des donneacutees Technique ndash le web seacutemantique
La reacutevolution des donneacutees est en marche Le web de donneacutees explose comme le web de documents a exploseacute agrave la fin des anneacutees 90
SemWebPro 18012011 6
Datalift
Activiteacutes Publication de jeux de donneacutees Recherche de nouvelles techniques et formalismes
pour ameacuteliorer et automatiser la publication Deacuteveloppement dune architecture modulaire
permettant dinteacutegrer des outils daide agrave la publication Organisation deacutevegravenements autour de la publication
sur le web de donneacutees
SemWebPro 18012011 7
Datalift
Partenaires
Processus de publication
SemWebPro 18012011 8
Processus de publication
SemWebPro 18012011 9
SemWebPro 18012011 10
Sommaire
1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)
SemWebPro 18012011 112 Seacutelection
SemWebPro 18012011 12
Les vocabulaires de mes amis hellip
Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees
Critegraveres drsquoutilisabiliteacute
Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip
Diffeacuterents types de vocabulaires
De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip
Les piliers du Linked Data Dublin Core FOAF SKOS
Bonnes et moins bonnes pratiques
Ex Programmes BBC vs legislationgovuk
Vocabulary of a Friend les vocabulaires en reacuteseau
Problegravemes linguistiques
Les vocabulaires existants sont en anglais agrave 99
Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo
SemWebPro 18012011 13
Vous avez dit laquo vocabulaire raquo
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 4
Datalift
Une expeacuterimentation agrave grande eacutechelle de la publication de donneacutees sur le Web
Objectifs - Publier des donneacutees de reacutefeacuterence - Automatiser le processus de
publication - Deacutemontrer linteacuterecirct de publier ses
donneacutees
SemWebPro 18012011 5
Datalift
Deux pheacutenomegravenes Socieacutetal ndash louverture des donneacutees Technique ndash le web seacutemantique
La reacutevolution des donneacutees est en marche Le web de donneacutees explose comme le web de documents a exploseacute agrave la fin des anneacutees 90
SemWebPro 18012011 6
Datalift
Activiteacutes Publication de jeux de donneacutees Recherche de nouvelles techniques et formalismes
pour ameacuteliorer et automatiser la publication Deacuteveloppement dune architecture modulaire
permettant dinteacutegrer des outils daide agrave la publication Organisation deacutevegravenements autour de la publication
sur le web de donneacutees
SemWebPro 18012011 7
Datalift
Partenaires
Processus de publication
SemWebPro 18012011 8
Processus de publication
SemWebPro 18012011 9
SemWebPro 18012011 10
Sommaire
1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)
SemWebPro 18012011 112 Seacutelection
SemWebPro 18012011 12
Les vocabulaires de mes amis hellip
Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees
Critegraveres drsquoutilisabiliteacute
Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip
Diffeacuterents types de vocabulaires
De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip
Les piliers du Linked Data Dublin Core FOAF SKOS
Bonnes et moins bonnes pratiques
Ex Programmes BBC vs legislationgovuk
Vocabulary of a Friend les vocabulaires en reacuteseau
Problegravemes linguistiques
Les vocabulaires existants sont en anglais agrave 99
Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo
SemWebPro 18012011 13
Vous avez dit laquo vocabulaire raquo
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 5
Datalift
Deux pheacutenomegravenes Socieacutetal ndash louverture des donneacutees Technique ndash le web seacutemantique
La reacutevolution des donneacutees est en marche Le web de donneacutees explose comme le web de documents a exploseacute agrave la fin des anneacutees 90
SemWebPro 18012011 6
Datalift
Activiteacutes Publication de jeux de donneacutees Recherche de nouvelles techniques et formalismes
pour ameacuteliorer et automatiser la publication Deacuteveloppement dune architecture modulaire
permettant dinteacutegrer des outils daide agrave la publication Organisation deacutevegravenements autour de la publication
sur le web de donneacutees
SemWebPro 18012011 7
Datalift
Partenaires
Processus de publication
SemWebPro 18012011 8
Processus de publication
SemWebPro 18012011 9
SemWebPro 18012011 10
Sommaire
1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)
SemWebPro 18012011 112 Seacutelection
SemWebPro 18012011 12
Les vocabulaires de mes amis hellip
Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees
Critegraveres drsquoutilisabiliteacute
Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip
Diffeacuterents types de vocabulaires
De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip
Les piliers du Linked Data Dublin Core FOAF SKOS
Bonnes et moins bonnes pratiques
Ex Programmes BBC vs legislationgovuk
Vocabulary of a Friend les vocabulaires en reacuteseau
Problegravemes linguistiques
Les vocabulaires existants sont en anglais agrave 99
Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo
SemWebPro 18012011 13
Vous avez dit laquo vocabulaire raquo
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 6
Datalift
Activiteacutes Publication de jeux de donneacutees Recherche de nouvelles techniques et formalismes
pour ameacuteliorer et automatiser la publication Deacuteveloppement dune architecture modulaire
permettant dinteacutegrer des outils daide agrave la publication Organisation deacutevegravenements autour de la publication
sur le web de donneacutees
SemWebPro 18012011 7
Datalift
Partenaires
Processus de publication
SemWebPro 18012011 8
Processus de publication
SemWebPro 18012011 9
SemWebPro 18012011 10
Sommaire
1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)
SemWebPro 18012011 112 Seacutelection
SemWebPro 18012011 12
Les vocabulaires de mes amis hellip
Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees
Critegraveres drsquoutilisabiliteacute
Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip
Diffeacuterents types de vocabulaires
De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip
Les piliers du Linked Data Dublin Core FOAF SKOS
Bonnes et moins bonnes pratiques
Ex Programmes BBC vs legislationgovuk
Vocabulary of a Friend les vocabulaires en reacuteseau
Problegravemes linguistiques
Les vocabulaires existants sont en anglais agrave 99
Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo
SemWebPro 18012011 13
Vous avez dit laquo vocabulaire raquo
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 7
Datalift
Partenaires
Processus de publication
SemWebPro 18012011 8
Processus de publication
SemWebPro 18012011 9
SemWebPro 18012011 10
Sommaire
1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)
SemWebPro 18012011 112 Seacutelection
SemWebPro 18012011 12
Les vocabulaires de mes amis hellip
Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees
Critegraveres drsquoutilisabiliteacute
Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip
Diffeacuterents types de vocabulaires
De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip
Les piliers du Linked Data Dublin Core FOAF SKOS
Bonnes et moins bonnes pratiques
Ex Programmes BBC vs legislationgovuk
Vocabulary of a Friend les vocabulaires en reacuteseau
Problegravemes linguistiques
Les vocabulaires existants sont en anglais agrave 99
Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo
SemWebPro 18012011 13
Vous avez dit laquo vocabulaire raquo
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Processus de publication
SemWebPro 18012011 8
Processus de publication
SemWebPro 18012011 9
SemWebPro 18012011 10
Sommaire
1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)
SemWebPro 18012011 112 Seacutelection
SemWebPro 18012011 12
Les vocabulaires de mes amis hellip
Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees
Critegraveres drsquoutilisabiliteacute
Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip
Diffeacuterents types de vocabulaires
De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip
Les piliers du Linked Data Dublin Core FOAF SKOS
Bonnes et moins bonnes pratiques
Ex Programmes BBC vs legislationgovuk
Vocabulary of a Friend les vocabulaires en reacuteseau
Problegravemes linguistiques
Les vocabulaires existants sont en anglais agrave 99
Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo
SemWebPro 18012011 13
Vous avez dit laquo vocabulaire raquo
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Processus de publication
SemWebPro 18012011 9
SemWebPro 18012011 10
Sommaire
1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)
SemWebPro 18012011 112 Seacutelection
SemWebPro 18012011 12
Les vocabulaires de mes amis hellip
Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees
Critegraveres drsquoutilisabiliteacute
Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip
Diffeacuterents types de vocabulaires
De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip
Les piliers du Linked Data Dublin Core FOAF SKOS
Bonnes et moins bonnes pratiques
Ex Programmes BBC vs legislationgovuk
Vocabulary of a Friend les vocabulaires en reacuteseau
Problegravemes linguistiques
Les vocabulaires existants sont en anglais agrave 99
Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo
SemWebPro 18012011 13
Vous avez dit laquo vocabulaire raquo
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 10
Sommaire
1 Introduction (FScharffe)2 Seacutelection des vocabulaires (BVatant)3 Conversion (RTroncy)4 Publication (BPoint)5 Interconnexion (FScharffe)6 Applications (RTroncy)
SemWebPro 18012011 112 Seacutelection
SemWebPro 18012011 12
Les vocabulaires de mes amis hellip
Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees
Critegraveres drsquoutilisabiliteacute
Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip
Diffeacuterents types de vocabulaires
De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip
Les piliers du Linked Data Dublin Core FOAF SKOS
Bonnes et moins bonnes pratiques
Ex Programmes BBC vs legislationgovuk
Vocabulary of a Friend les vocabulaires en reacuteseau
Problegravemes linguistiques
Les vocabulaires existants sont en anglais agrave 99
Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo
SemWebPro 18012011 13
Vous avez dit laquo vocabulaire raquo
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 112 Seacutelection
SemWebPro 18012011 12
Les vocabulaires de mes amis hellip
Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees
Critegraveres drsquoutilisabiliteacute
Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip
Diffeacuterents types de vocabulaires
De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip
Les piliers du Linked Data Dublin Core FOAF SKOS
Bonnes et moins bonnes pratiques
Ex Programmes BBC vs legislationgovuk
Vocabulary of a Friend les vocabulaires en reacuteseau
Problegravemes linguistiques
Les vocabulaires existants sont en anglais agrave 99
Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo
SemWebPro 18012011 13
Vous avez dit laquo vocabulaire raquo
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 12
Les vocabulaires de mes amis hellip
Qursquoest-ce qursquoun (bon) vocabulaire pour des donneacutees lieacutees
Critegraveres drsquoutilisabiliteacute
Simpliciteacute visibiliteacute peacuterenniteacute inteacutegration coheacuterence hellip
Diffeacuterents types de vocabulaires
De meacutetadonneacutees de reacutefeacuterence de domaine geacuteneacuteraliste hellip
Les piliers du Linked Data Dublin Core FOAF SKOS
Bonnes et moins bonnes pratiques
Ex Programmes BBC vs legislationgovuk
Vocabulary of a Friend les vocabulaires en reacuteseau
Problegravemes linguistiques
Les vocabulaires existants sont en anglais agrave 99
Approche terminologique quels vocabulaires pour laquo Eveacutenement raquo laquo Organisation raquo
SemWebPro 18012011 13
Vous avez dit laquo vocabulaire raquo
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 13
Vous avez dit laquo vocabulaire raquo
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
ltrdfProperty rdfabout=httpxmlnscomfoaf01makergtltowlequivalentProperty rdfresource=httppurlorgdctermscreatorgt
ltrdfPropertygt Exemple 2 Event dans Bio sous-classe de Event dans DCMI Type
lt owlClass rdfabout=httppurlorgvocabbio01Eventgtlt rdfssubClassOf rdfresource=httppurlorgdcdcmitypeEventgt
lt owlClassgt
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
httpwwwlegislationgovukukpga198567dataxml
SemWebPro 18012011 35
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Un peu drsquoabstraction
Identifiant URIhttpwwwlegislationgovukidtypeyearnumber[section]
Document URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]
Repreacutesentation URIhttpwwwlegislationgovuktypeyearnumber[section][authority][extent][version]dataext
SemWebPro 18012011 36
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Quid des autres secteurs
Education httpeducationdatagovukdocschool
Lrsquoorganisation httpreferencedatagovukdocdepartment
Transport httptransportdatagovukdocstation
SemWebPro 18012011 37
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
SemWebPro 18012011 38
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Repreacutesenter des eacuteveacutenements en LODE
39SemWebPro 18012011
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Choisir des URIs pour les dimensions
Approach REST httpdatalinkedeventsorgevent httpdatalinkedeventsorgagent httpdatalinkedeventsorglocation httpdatalinkedeventsorgmedia httpdatalinkedeventsorguser httpdatalinkedeventsorgcategory
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Des solutions pour tous les cas de figure hellip
SemWebPro 18012011 44
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
D2R Database to RDF mapping
D2RQ platformhttpwww4wiwissfu-berlindebizerd2rqspec
SemWebPro 18012011 45
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
D2RQ Map
SemWebPro 18012011 46
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
D2RQ Map (preacuteambule)
SemWebPro 18012011 47
D2RQ Namespace prefix d2rq lthttpwwwwiwissfu-berlindesuhlbizerD2RQ01gt
Namespace of the ontology prefix lthttpannotationsemanticweborgiswciswcdamlgt
Namespace of the mapping file does not appear in mapped data prefix map ltfileUsersd2rexamplen3gt
Other namespaces prefix rdfs lthttpwwww3org200001rdf-schemagt prefix xsd lthttpwwww3org2001XMLSchemagt
mapDatabase1 a d2rqDatabase d2rqjdbcDSN jdbcmysqllocalhostiswc d2rqjdbcDriver commysqljdbcDriver d2rqusername user d2rqpassword password
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
D2RQ Map (creacuteation de tables)
SemWebPro 18012011 48
CREATE TABLE Conferences (ConfID int Name text Location text)
mapConference a d2rqClassMapd2rqdataStorage mapDatabase1 d2rqclass Conference d2rquriPattern httpconferencesorgcompconfnoConferencesConfID
mapeventTitle a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty eventTitle d2rqcolumn ConferencesName d2rqdatatype xsdstring
maplocation a d2rqPropertyBridge d2rqbelongsToClassMap mapConference d2rqproperty location d2rqcolumn ConferencesLocation d2rqdatatype xsdstring
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Jens Bech Chief Risk Officer Asset Protection Agency
pound165000 -pound169999 No pension
Ion Dagtoglou Chief Invesment Officer
Asset Protection Agency
pound165000 -pound169999 No pension
Brian Scammell Chief Credit Officer
Asset Protection Agency
pound130000 -pound134999 4 days per week
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Peacuterenniteacute Industrialisation Packaging Exploitabiliteacute Adaptabiliteacute
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
httpwwww3org200001rdf-schema gtltPrefix id=dbpedia namespace=
httpdbpediaorgontology gtltPrefix id=gn namespace=
httpwwwgeonamesorgontology gt
ltDataSource id=dbpediagtltEndpointURIgthttpdemo_sparql_server1sparqlltEndpointURIgtltGraphgthttpdbpediaorgltGraphgt
ltDataSourcegt
ltDataSource id=geonamesgtltEndpointURIgthttpdemo_sparql_server2sparqlltEndpointURIgtltGraphgthttpswsgeonamesorgltGraphgt
ltDataSourcegt
ltThresholds accept=09 verify=07 gtltOutput acceptedLinks=accepted_linksn3
verifyLinks=verify_linksn3mode=truncate gt
ltInterlink id=citiesgtltLinkTypegtowlsameAsltLinkTypegtltSourceDataset dataSource=dbpedia var=agt
ltRestrictTogta rdftype dbpediaCity
ltRestrictTogtltSourceDatasetgtltTargetDataset dataSource=geonames var=bgt
ltRestrictTogtb rdftype gnP
ltRestrictTogtltTargetDatasetgtltLinkConditiongt
ltAVGgtltCompare metric=jaroSimilaritygt
ltParam name=str1 path=ardfslabel gtltParam name=str2 path=bgnname gt
ltComparegtltCompare metric=numSimilaritygt
ltParam name=num1 path=adbpediapopulationTotal gt
ltParam name=num2 path=bgnpopulation gtltComparegt
ltAVGgtltLinkConditiongt
ltInterlinkgtltSilkgt
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Datalift y travaille
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 996 Applications
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 100
Visualiser vos donneacutees
Tabulator(CSAIL MIT)
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 101
Visualiser vos donneacutees
Disco(Free Universityof Berlin)
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 102
Visualiser vos donneacutees
Marbles(Free Universityof Berlin)
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 103
Visualiser vos donneacutees
Zitgist(Zitgist LLC)
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 104
Visualiser vos donneacutees
OpenLink Data Explorer(OpenLink Software)
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 105
Visualiser vos donneacutees
RKBExplorer httpwwwrkbexplorercomHumboldt httphumboldt-projectorgFenfire httpfenfireorgCliopatria
httpe-culturemultimediannlsoftwareClioPatriashtml
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 - 106
VisiNav
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 - 107
Sigma
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 - 108
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
SemWebPro 18012011 109
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Quelques exemples ameacutericains
SemWebPro 18012011 110
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Quelques exemples ameacutericains
SemWebPro 18012011 111
httpdata-govtwrpiedudemoUSForeignAiddemo-1554html
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Des applications mobiles
SemWebPro 18012011 112
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
- Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
- Sommaire
- Slide Number 3
- Datalift
- Datalift
- Datalift
- Datalift
- Processus de publication
- Processus de publication
- Sommaire
- Slide Number 11
- Les vocabulaires de mes amis hellip
- Vous avez dit laquo vocabulaire raquo
- Les vocabulaires pour les donneacutees lieacutees
- Qursquoest-ce qursquoun bon vocabulaire
- Un vocabulaire crsquoest aussi une communauteacute
- Types de vocabulaires
- Vocabulaires de meacutetadonneacutees
- Vocabulaires de reacutefeacuterence
- Vocabulaires de domaine
- Vocabulaires laquo geacuteneacuteralistes raquo
- Le Trio Gagnant
- Dublin Core
- Friend of a Friend (FOAF)
- Exemples drsquoutilisation de FOAF
- SKOS
- Liaison entre vocabulaires
- Bonnes (et moins bonnes) pratiques
- Vocabulary of a Friend
- Slide Number 30
- Les 4 Principes des Donneacutees Lieacutees
- Publier des Donneacutees 5 eacutetoiles
- Publier des Donneacutees 5 eacutetoiles
- URL Design et URL Pattern
- URL Design et URL Pattern
- Un peu drsquoabstraction
- Quid des autres secteurs
- URI Pattern dans REST
- Repreacutesenter des eacuteveacutenements en LODE
- Choisir des URIs pour les dimensions
- Et en France
- Un peu drsquoexplications
- Et si crsquoeacutetait agrave refaire
- Outils de conversion vers RDF
- D2R Database to RDF mapping
- D2RQ Map
- D2RQ Map (preacuteambule)
- D2RQ Map (creacuteation de tables)
- Conversion et Publication
- Triplify Relational data to JSONRDF
- Triplify Relational data to JSONRDF
- R2RML Base de donneacutees vers RDF
- Exemple
- Exemple
- Exemple
- Exemple
- Premiegravere eacutetape transformation de la table des personnes
- Deuxiegraveme eacutetape transformation de la table des livres
- Troisiegraveme eacutetape lier les deux tables entre elles
- Travailler sur des spreadsheets
- Google acquiert Freebase
- Extension RDF agrave Google Refine
- Conversion en RDF souhaiteacutee
- Google Refine et RDF
- Google Refine et RDF
- Google Refine et RDF
- Publish My Data
- Slide Number 68
- La publication RDF Store
- Les Composants de la publication
- Un RDF Store est sans scheacutema applicatif
- RDF Store La notion de Graphe
- RDF Store Les Graphes Nommeacutes
- RDF Store Les Infeacuterences
- RDF Store SPARQL
- RDF Store Deacutereacutefeacuterencement
- Exemples de Deacutereacutefeacuterencement
- RDF Store neacutegociation de contenu
- Analyse des RDF Store la meacutethode QSOS
- Analyse des RDF Store Deacutefinition des critegraveres
- RDF Store Un extrait des eacutevaluations
- RDF Store La Mise agrave Jour
- Architecture drsquoalimentation exemple de Datalift
- Slide Number 84
- Web de donneacutees et interconnexions
- owlsameAs
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Comment interconnecter ses donneacutees
- Les outils critegraveres danalyse
- Les outils critegraveres danalyse
- Les outils
- Les outils
- Exemple de speacutecification pour Silk
- Ou trouver des liens
- Vers linterconnexion automatique
- Slide Number 99
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- Visualiser vos donneacutees
- VisiNav
- Sigma
- Slide Number 108
- Nos Deacuteputeacutes FR
- Quelques exemples ameacutericains
- Quelques exemples ameacutericains
- Des applications mobiles
- Des applications mobiles
- ASBOrometer
- Chercher un dentiste pregraves de chez vous
- Mashups hellip Mashups hellip Mashups hellip
- Mashups hellip Mashups hellip Mashups hellip
-
top related