etat de lart de la recherche en ligne
Post on 25-Dec-2014
983 Views
Preview:
DESCRIPTION
TRANSCRIPT
Etat de l’art de la recherche en ligne
Geli MENG
1
Plan
1. Introduction1) Définition2) Comment ca marche?
2. DéveloppementA. Principaux moteurs de rechercheB. Exemple des différents moteur de recherche en
ligne1) Meta moteur2) Optimation des résultats de la classification3) Moteur de recherche pour les demandes particulières 4) Moteur de recherche pour les sociaux bookmarking5) Google Search Wiki
C. Les recommandation
3. Conclusion4. Références 2
Un moteur de recherche est un logiciel permettant de
retrouver des ressources (pages web, forums Usenet,
images, vidéo, fichiers, etc.) associées à des mots quelconques.
3
1.Introduction 1). Définition
Outil de recherche sur le web constitué de « robots », encore appelés bots, spiders, crawlers ou agents qui parcourent les sites à intervalles réguliers et de façon automatique (sans intervention humaine, ce qui les distingue des annuaires) pour découvrir de nouvelles adresses (URL). Ils suivent les liens hypertextes (qui relient les pages les unes aux autres) rencontrés sur chaque page atteinte. Chaque page identifiée est alors indexée dans une base de données, accessible ensuite par les internautes à partir de mots-clés.
Plus précisément sur 3 étapes:1. l’exploration2. l’indexation3. la recherche
1.Introduction 2). Comment ça marche?
4
1. L’exploration : le web est systématiquement explore par un robot
d’indexation suivant récursivement tous les hyperliens qu’il trouve et
récupérant les ressources jugées intéressante. L’exploration est lancée
depuis une ressource pivot, comme une page d’annuaire web. Un
moteur de recherche est d’abord un outil d’indexation, qu’il dispose d’une technologie de collecte de documents a distance sur
les sites web via un outil que l’on n appelé robot.
5
Comment ça marche sur 3 étapes
6
2. L’indexation : l’indexation des ressources récupérées consiste à
extraire les mots considères comme significatifs du corpus à
explorer. Les mots extraits sont enregistres dans une base
de donne organisée comme un gigantesque
dictionnaire inverse qui permet de retrouver rapidement dans quel
chapitre de l’ouvrage se situe un terme significatif donne.
7
3. La recherche : la recherche correspond a la partie requête du
moteur qui restitue les resultats.les résultats que l’on effectue sur un
moteur de recherche (résultats naturels) vont apparaitre par
ordre de pertinence selon le moteur qui mesure le taux de
pertinence et de popularité de chaque résultat.
1. le correcteur orthographique : il permet de corriger les erreurs introduite dans les mots de la requêtée et s’assurer que la pertinence d’un mot sera bien prise en compte sous sa forme.
2. le lemmatiseur : il permet de réduire les mots recherches a leur lemme et ainsi d’étendre leur portée de recherche.
3. l’anti dictionnaire : utilise pour supprimer a la fois dans l’index et dans les requêtes tous les mots vides (comme de ,le ,la) qui sont non discriminants et perturbent le score de recherche en introduisant du bruit.
Source : Wikipédia
8
Aussi il y a des modules complémentaires
Google, Yahoo, Live de Microsoft
La part de marché de Google aux Etats-Unis continue de croître inexorablement, de 67,25 % en mars à 67,9 % pour avril selon Hitwise. Yahoo et Microsoft connaissent quant à eux un léger recul. Le premier passe de 20,29 % à 20,28 % d'un mois sur l'autre contre 6,65 % à 6,26 % pour Microsoft. Quatrième moteur de recherche, Ask.com augmente ses parts de 0,8 % et passe à 4,17 %. Les secteurs du tourisme, des loisirs, des finances, du sport et des jeux en ligne ont connu une augmentation à deux chiffres de leurs visiteurs en provenance des moteurs entre avril 2007 et avril 2008.
Source : JDN
9
2.Développement A. Principaux moteurs de recherche
Les top 5 moteurs de recherche
Source : Médiamétrie - Observatoire des Usages Internet -xitimontor10
1) Meta moteur2) Optimation des résultats de la
classification3) Des moteur de recherche pour les
demandes particulières4) Moteur de recherche pour les
sociaux bookmarkings5) Google SearchWiki
2.Développement B. Exemples des différents moteurs de recherche
11
www.searche.com: C’est un moteur de recherche en ligne qui combine tous les résultats de moteur de recherche comme Google, Yahoo wikipedia, MSN, ask, open directory etc. Parmi les résultats on peut voir les sites web, vidéo, blog,et download.il est un moteur de moteur.
www.findforward.com: Il permet aux utilisateurs de choisir leur propre méthode de recherche avec un simple menu déroulant. il utilise principalement les sources de Google est aussi les sources d’autre moteur de recherche comme MSN ,Yahoo ,Ask, Technorati blog line et ainsi de suite.
Polymeta: C’est un moteur de recherche très pertinent ,il combine Google Yahoo Ask Youtube Myspace Flickr Webshot Icerocket Technorati etc. Dans le page de résultats trouve on peut voir trois principales rubriques : 1.le cote gauche qui défini les différents catégories, le cote centrée sont des ressources et des liens webpage, le cote droit présente des images.
Ex : Je tape « Xbox 360 » comme mot-clé, et voici les résultats.
1)Meta moteur
12
13
Search.com
14
Find forward
15
PolyMeta
• Clusty: www.clusty.com Il est a la base d’un moteur de recherche
intégré , qui interroge plusieurs moteur de recherche,
mais il nous sort pas une longue liste de résultats
mais des résultats après sa catégorisation.• Mooter : www.mooter.com
2) Optimation des résultats de la classification
16
Clusty
17
Mooter
18
www. Metaglossary.com
C’est un moteur de recherche spécialisé dans la
définition, concept, et des thèmes spécialisés.
3) Moteurs de recherche pour les demandes particulières
19
MetaGlossary
20
Voir aussi:Ms.Dewey : www.msdewey.com S’il y a une très jolie demoiselle qui vous
accompagner à trouver des informations en ligne, ce serait très sympa, voila ms dewey, elle-même va vous parler et faire des gestes pour attirer votre attention et aussi vous parler pour vous aider à effectuer une recherche. L’idée est originale par le biais de flash. Si on lui répond pas pour un petit moment, elle va même vers l’écran pour vous réveiller.
21
22
Ms.Dewey
• Le concept de social bookmarking• Infopirate.org/social-bookmark-Search : un
moteur de recherche qui interroge tous les systèmes de bookmark comme del.icio .us, blinklist,blogmark ,diig.
4) Moteurs de recherche pour les sociaux bookmarking
23
Le concept de social bookmarkingDéfinition :Le social bookmarking est une façon pour les
internautes de stocker, classer, chercher et partage leurs liens favoris.
Dans un système ou réseau de bookmaking social, les utilisateurs enregistrent des listes de ressources web
qu’ils trouvent utiles, ces listes sont accessibles aux
utilisateurs d’un réseau ou site web. D’autres utilisateurs ayant les mêmes
centres d’intérêt peuvent consulter les liens par sujet catégorie étiquette
ou même de façon aléatoire. 24
Qu’est-ce que c’est SearchWiki ?
C’est une manière de personnaliser les résultats de recherche fournis par Google.
"We don’t close any doors. We constantly evaluate signals" that are incorporated into the search results algorithm. "Search is adapting to the Internet as it becomes a more participatory medium. Now you have people telling us specific things about how they’d like to see their search results."
Source : Google officiel blog
5)Google SearchWiki
26
Google SearchWiki
27
Comment structurer le contenu en fonction de moteur de recherche?
• Soigner les éléments du code source : URL, balise titre, balise méta.
• Choisir une écriture lisible et conviviale et produire du contenu original avec la bonne discription(meta discription dans le code source).
• Eviter d’ utiliser des url trop longue.
2.Développement C. Recommandations
28
Sortons-nous un peu de Google et Yahoo,
l’univers de recherche et des référencement en
ligne est très riche .
3.Conclusion
29
30
4.Références
http://www.polymeta.comhttp://novovision.fr/?Google-SearchWiki-le-vertige-d-unhttp://www.webrankinfo.com/http://googleblog.blogspot.com/http://www.journaldunet.com/http://www.xiti.com/fr/Solutions/Gratuit.aspxhttp://clusty.com/http://www.mooter.com/http://www.metaglossary.com/
top related