webinar : les enjeux du moteur de recherche
TRANSCRIPT
1
Les enjeux du moteur de recherche de votre site Web
2
Core-Techs – Nos métiers
Formation & coaching
Conseil Intégration, développement,
expertise technique
Web et UX design
3
Les solutions de search intégrées
4
Aujourd’hui les internautes veulent :
5
Et souvent, pour trouver quelque chose sur votre site, ils utilisent ça :
Google a ses limites dans bien des cas.Il ne propose pas de réponse personnalisée, adaptée ou pertinente selon le contexte du site Internet ou selon les besoins des utilisateurs.Il a une présentation générique pour tous les utilisateurs, sans prendre en compte les spécificités du site Web.
6
OBESITE DE L’INFORMATION
Nous faisons face à une croissance exponentielle des contenus sur le Web.
Face cette obésité de l’information, nous sommes tous différents dans notre recherche d’information.
Nous n’avons pas les mêmes méthodes (mots-clés, expressions…), pas les mêmes démarches, pas les mêmes habitudes. La pertinence n’est pas la même pour tout le monde. Un même résultat peut satisfaire une personne, mais pas l’autre.
7
Visuel Big Data BIG DATA (données massives)
Nous produisons un nombre incommensurable de données (personnelles, publiées sur le web ou non, …) .
Toutes ces données sont stockées quelque part et tant qu’elles ne sont pas exploitées, elles ne servent à rien.
Ici l’enjeu des moteurs de recherche est d’être capable d’analyser notre comportement sur le Web et ainsi d’identifier nos habitudes, nos besoins.
8
HETEROGENEÏTE DES SOLUTIONS
• Hétérogénéité technique : bases de données, serveurs de fichiers, noSQL, RDF, .csv, document, ….
• Hétérogénéité de structure : gabarits, documents non structurés, thésaurus, taxonomie, documents multi-médoa…
Au final, pour une même donnée, il y a plusieurs manières de la gérer, la stocker, la labéliser, la rechercher…
9
BESOIN DE SENS
Le travail principal du moteur est de donner du sens au contenu, au produit, aux dépendances entre les contenus; il va réduire le bruit, donner de la pertinence à une recherche, …
10
UN MOTEUR CA FAIT QUOI ?
11
Indexe Transforme
Restitue Expose
12
Bases de données, sites web, référentiels
documentaires, fichiers, données structurées, non structurées, …
Transforme
Restitue Expose
Un moteur indexe, c’est-à-dire qu’il est capable de récupérer des contenus quel que soit leur format de stockage.
13
IndexeAlignement,
structuration, pondération,
dédoublonnage, scoring, matching, enrichissement, …
Restitue Expose
En indexant les données, le moteur va les transformer.
14
Indexe Transforme
Facettes, suggestions,
auto-complétion, aides à la
recherche, …Expose
Il restitue le contenu. Il peut proposer des alternatives, suggestions ou encore analyser une requête.
15
Indexe Transforme
RestitueRDF,
moissonnage, Sparql, open
data, …Toutes les données doivent être capables de « parler » les unes aux autres. Le moteur doit donc enrichir ce qu’on appelle le web des données.
16
16/12
Un bon moteur indexe tout type de contenu
17
17/12
Un bon moteur propose différentes logiques d’autocomplétion
18
18/12
• Facettes de valeurs• Facettes de date• Facette par arbre / pivot• Facette par intervalle• Facette par catégorie / type
Un bon moteur gère des facettes variables
19
19/12
Multilinguisme
20
Un bon moteur optimise la pertinence
Optimisations linguistiques
• Racinisation• Synonymie• Stop words• Orthographe
Optimisations statistiques
• Scoring et pondération
• Text mining• Proximité
21
Un bon moteur suggère d’après le corpus
22
Contextualisation des résultats
23
Moteur de recommandations & cross-content
24
Un outil de gestion de campagnes promotionnelles
25
Recherche géospatiale
26
Recherche multi-site, multi-source
Le moteur de recherche est capable de parcourir toutes ces sources et de restituer les données via une seule interface.
27
Optimisation des performances
La capacité technique du moteur à monter en charge et à répondre au volume de consultation, de réponse.
28
Un back-office de suivi statistique
Utile afin de s’améliorer. On a accès au:• Nombre de requêtes,• Requêtes les plus fréquentes,• Requêtes n’ayant abouti à aucun résultat,• Temps moyen de réponse,• …
29
Un outil d’alignement des données
CAPTER TRANSFORMER ENRICHIR ANALYSER
30
Un outil dédié au Web sémantique
• Structuration RDF & URI• Mise à disposition de Sparql End Point• Intégration de thésaurus et d’ontologies• …
31
Nos recommandations pour réussir un projet de search
RECHERCHER LA SIMPLICITE !
Quels sont les besoins
métiers ?
Quels sont les contenus et leur structuration ?
Quelles sont les attentes
utilisateur ?
Travailler sur une logique
itérative avec des utilisateurs
métier
Suivre les statistiques de fonctionnement
32