référencement webufrsciencestech.u-bourgogne.fr/master1/cwa/referencement.pdf · le...

56
Référencement Web

Upload: others

Post on 19-Jul-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

RéférencementWeb

Page 2: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

1.Introduction

Page 3: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Leréférencementnaturel

• Premiersmoteursderecherche:• Yahoo:undespremiersannuairesduWeb

• 1990:nombrecroissantdesitesWeb• Besoind’outilsderecherche

• Vers1994:lesannuaires• Yahoo:sitesdescatégories/sous-catégories

• Moteur:Webcrawler,excite,Lycos,Infoseek,…,Altavista• Lesannuaireslongtempsutilisés• Tousdisparues• Ledernier:DMOZ:2017

Page 4: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Leréférencementnaturel

• Début90• Peudesites,peudepages• Algorithmessimples• Lenombredefoisderequêtes– apparitiondanslapage• Introductiondu« keywordstuffing »

• Google• IA• Apprentissageautomatique• Réseauxdeneurones

Page 5: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Leréférencementnaturel

• Produitsdanslagrandedistribution• Siteindexé/référencé:BDdumoteurderecherche• Nemontrerquelespageslesplusintéressantes• Positionenfonctiondesmotscléslesplusintéressants• Estcequelepositionnementaportésesfruits?

Page 6: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Commentfonctionnelemoteurderecherche?• Semblesimplemaistrèscomplexeenréalité• Maitriserlefonctionnementdumoteurderecherchepourbienréférenceretoptimiservotresite• Lemoteurderechercheparcourtlesiteetindexelespages• Constitutiond’unebasededonnéesindex• Traitementderequêtesetinterrogationdel’index• Restitutiondesrésultats(SERP)• Liensorganiques(naturels)• Lienscommerciaux

Page 7: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Technologiesdesmoteursderecherche

• Principaux:GoogleetMicrosoft• France:Qwant (Bing)etOrange/voilà• Technologiesderechercheparlesportailsderecherchefrancophones(2018)

Technologiesderecherche Google Yahoo Bing OrangeGoogle XYahoo XBing XOrange XQwant XFree XSFR/Alice XBouygues X

Page 8: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Technologiesderechercheparlesportailsderechercheanglophones(2018)

Technologiesdesmoteursderecherche

Technologiesderecherche Google Yahoo BingGoogle XYahoo XBing XMSN XFacebook XAOL X

Page 9: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Fonctionnementdesmoteursderecherche

Fonctionnement des outils de rechercheCHAPITRE 2 27

Principe de fonctionnement d’un moteur de recherchePlusieurs étapes sont nécessaires pour le bon fonctionnement d’un moteur de recherche : dansun premier temps, des robots explorent le Web de lien en lien et récupèrent des informations(phase de crawl). Ces informations sont ensuite indexées par des moteurs d’indexation, lestermes répertoriés enrichissant un index – une base de données des mots contenus dansles pages – régulièrement mis à jour. Enfin, une interface de recherche permet de restituerdes résultats aux utilisateurs en les classant par ordre de pertinence (phase de ranking).

Tableau 2-2 Technologies de recherche utilisées par les principaux portails de recherche anglophones en 2009

Sites web Google Yahoo! Bing Exalead Ask.com

Google X

Yahoo! X (2009) X (> 2009)

Bing X

MSN X

AllTheWeb X (2009) X ? (> 2009)

AltaVista X (2009) X ? (> 2009)

Ask.com X ? (> 2009) X

Exalead X

Hotbot X (2009) X

Mise à jourLes données de ce tableau, valables à la fin 2009, peuvent fluctuer en fonction des contrats signésd’une année sur l’autre. Une mise à jour de ces informations est disponible à l’adresse suivante :http://docs.abondance.com/portails.html.

Technologies de recherche

Figure 2-1

Les différentes étapes du fonctionnement des moteurs de recherche

Requête

Résultat

Page 10: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Lesspiders

• Robots,crawlers,agentsoubots• VisitentenpermanencelespagesWeb(lesliens)• Prennentencomptelesmodifications• LitlespageswebetstockentlecontenusurleDDdumoteur

• Détecterlesliensetidentifierdenouvellespages

• Googlebot /Bingbot• Robots.txt etbalisemeta« robots »utilisésparleswebmasters

Ref :It-connect

Page 11: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Lesspiders

• Vérifies’ilconnaîtlapage,silaversionestplusrécente• Oui:supprimel’ancienneetsauvegardelanouvelleetl’indexestmisàjour

• Datededernièremodification• Latailledelapage• Tauxdemodificationducodehtml• Leszonesmodifiées(ex:lien)• Lespiderdoitdétecterunevraiemodification

Page 12: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Lesspiders

• Période« GoogleDance »:Miseàjourdesindexs mensuelle• Aujourd'hui:encontinu

• Visitentpluslespagesquichangentsouventlecontenu(ex:sited’actualité)• Moinslespagesstatiques

• Affichagedegoogle deladateetl’heured’indexation• Suividesliensparlesspiders:

• Indexationdepagesorphelines• Liensnonprisencompteparlesmoteursderecherche

• Fichierslogs:historiquedeconnexionsetspiders• Outils:RobotStats,Watussi,Botify,OnCrawl

Page 13: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

BudgetCrawletindexation

• RessourcesallouéesaucrawldusiteWeb:• Lesperformancesduserveur• Laprofondeurdansl’arborescence• Laqualitéducontenu• LepageRank

• Indexation• Limitedelacapacitéd’indexation• <100liens• Aujourd’hui:pasdelimite

Page 14: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Indexation

• Indexprincipal(corpus)• Indexinversé(termesclés)• Traitementd’unerequêtedanslemoteurderecherche

• 2017:Googlecrawle20milliardsdesitesWebparjour

Page 15: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Systèmederanking

• Algorithmespourleclassement• Pertinence• Positiondumotdanslapage• Poids• Similaritéaveclarequête• Distanceentrelesmots

• Popularité• Comportementutilisateur• Clustering

Page 16: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

FonctionnementdeGoogle

• Serveurd'url.• explorateur(crawler).• Serveurdestockage.• Indexeur.• Solveurd'url.• chercheur(searcher).• Pagerank.• Repository.• Lexique.• Ancre• lexique

is work which can get results by post-processing the results of existing commercial search engines, or produce small scale “individualized’ search engines. Finally, there has been a lot of research on informa- tion retrieval systems. especially on well controlled collections [ 111.

However. work on information retrieval has mostly been on fairly small. well controlled col- lections such as the Text Retrieval Conference [lo]. Things that work well on TREC often do not produce good results on the Web. For example, the standard vector space model tries to return the document that most closely approximates the query, given that both query and document are vectors defined by their word occurrence. On the Web, this strategy often returns very short documents that are the query plus a few words. For example. we have seen a major search engine return a page containing only “Bill Clinton Sucks” and picture from a “Bill Clinton” query. Given examples like these, we believe that the standard information retrieval work needs to be extended to deal effectively with the Web.

The Web is a vast collection of completely uncon- trolled heterogeneous documents. Documents vary significantly in language, format, and style. There can be many orders of magnitude of difference in two documents’ size, quality, popularity, and trust- worthiness. All of these are significant challenges to effective searching on the Web. They are somewhat mediated by the availability of auxiliary data such as hyperlinks and formatting and Google tries to take advantage of both of these.

4. System anatomy

In this section, we will give a high level overview of how the whole system works as pictured in Fig. 1. Further sections will discuss the applications and data structures not mentioned in this section. Most of Google is implemented in C or C++ for efficiency and can run in either Solaris or Linux.

In Google, the Web crawling (downloading of Web pages) is done by several distributed crawlers. There is a URLserver that sends lists of URLs to be fetched to the crawlers. The Web pages that are

Fig I High level Goo$le architecture

fetched are then sent to the storeserver. The store- server then compresses and stores the Web pages into a repository. Every Web page has an associated 1D number called a docID which is assigned whenever a new URL is parsed out of a Web page. The in- dexing function is performed by the indexer and the sorter. The indexer performs a number of functions. It reads the repository, uncompresses the documents. and parses them. Each document is converted into a set of word occurrences called hits. The hits record the word, position in document, an approximation of font size, and capitalization. The indexer distributes these hits into a set of “barrels”, creating a partially sorted forward index. The indexer performs another important function. It parses out all the links in every Web page and stores important information about them in an anchors tile. This file contains enough in- formation to determine where each link points from and to. and the text of the link.

The URLresolver reads the anchors tile and con- verts relative URLs into absolute URLs and in turn into doclDs. It puts the anchor text into the forward index, associated with the docfD that the anchor points to. It also generates a database of links which are pairs of docIDs. The links database is used to compute PageRanks for all the documents.

Page 17: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

FonctionnementdeGoogle

• Leserveurd’URL:envoieauxcrawlers lesadressesquidoiventêtrevisitées• Serveurdestockage:– Compressiondespages– Sauvegardedanslerepository – NouvellepageassociéeàundocID.• Indexeur:– Lecturedanslarepository.– Décompressiondesdocuments.– Parsing despages.– Conversiondespagesen«hitlist »(listed'occurences).– Distributiondes«hits»dansles«barrels»defaçonpartiellementtriée.– Parsing desurletenvoiedesinformationsdanslesancres.– Créationdulexique.• Gestionnaired’ancres:stockecertainesinformationscrééesparl’indexeur(leslienshypertextesetlesancres)

Page 18: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

FonctionnementdeGoogle

• Legestionnairedeliens:contientdespairesdedocID• PageRankrécupèrelesinformationsdecetteBDetcalculel’indicedepopularité• Letrieur:docID ->WordID.Créationdel’indexinversé• Comparaisondesmotsdutrieuravecceuxdulexique.Ajoutdenouveauxmots• Interfacerecherche:répondauxrequêtesutilisateurs.Elleutiliselelexique,l’indexinversé,lesadressesURLs associéesetlepageRank.

Page 19: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

2.Audébutduréférencement

Page 20: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Méthode

1. Choixdesmotsclés2. Choixdesmoteursàprendreencompte3. Création/modificationdespagesenfonctionde1et24. Vérificationdelapriseencomptedespagesparlemoteurde

recherche5. Positionnement6. Améliorationdurésultat

Page 21: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Choixdesmotsclés

• Choisirlesbonsmotsclés• Etapetrèsimportante• L’intérêt:souventsaisisparlesutilisateurs• Lafaisabilité:positionnementrapide

• Longtail :Lesrequêteslonguessontd’actualité

Page 22: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Trouverlesmotsclés

• L’intuition• Lesbasesdedonnées:SEMRush,Wordtracker,KeywordDiscovry :termessouventdemandés

• Motsclésàpartirdestermesdedépart• Lesgénérateursdemotsclés• Demanderàsonentourage• Utilisationdesmoteursderecherche• Related searches• Consultationdesbalisesmeta dessitesconcurrents• Fautedefrappe• Autocomplétion

• Correctiondesrequêtes• Lesrequêtescomposés

Page 23: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Fautesdefrappe

• Identifierlesfautesdefrappe• Générateursdemotsclés• L’analysedesmotscléssurlesite• Googlesuggest• Demanderàl’entourage• Outil:générateurdefautedefrappe

• Référencersonsite• Insérerdespages• URLetattributsalt• Mettredesfautesdanssespages• Nepascacherdanslespages

Page 24: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Choixdesmotsclés

• Unelistede10motsclés• KeywordPlanner :Google• Etudiezlalistedesmotsproposésparl’outil• Classerparnombrederecherches• Supprimerlesexpressionsquinevousintéressentpas• Etablirdesfourchettesdenotes• Prendreencomptelepotentieletlafaisabilité

Page 25: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Référencementetmoteursderecherche

Page 26: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

3.Référencement« Inpage »

Page 27: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Critèresinpage

• Comprendrelefonctionnementdesspiders• Commentgoogle voitlesite(cache)• UtiliserlenavigateurLynx(queletexte)

Page 28: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Critèresinpage

• Balisetitle• Critèreinpagetrés important• Unebalise<title>pourtouteslespages• Unsujetprécisparpage

• Balisehn• PourattribuerunpoidsauxpagesWebpourunerequête• Zonesstratégiques• Menudenavigationpourcomprendrelastructuredusite(danslapaged’accueil)• Pasdanslefooter/header/nav (dansunepagecontenu)• Choisirlesmotscléspourunebalisehn• Onpeutl’utiliserpouruneimage,alt seraprisencompte:nepasabuser!

Page 29: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Critèresinpage

• Lamiseengras• Balise<strong>• Lemettredanslecss neserapasprisencompteparlemoteurderecherche

• Lesliensinternes• Pourlapage• Pourlapagepointée

• Lesbalisesmeta• Dublincore n’apasd’intérêt• Metadescription:repriseparlemoteurderecherchesinonunextraitdelapage(doitêtreassezlongetcohérent)

• Metakeywords:quelemoteurbingsemblel’utiliser• New_keywords :PrisencompteparGoogleactualitédepuis2012

Page 30: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Critèresinpage

• Attributsalt ettitle desimagesetdesliens• Altdeimg pargoogle pasbing• Title niar google,niparbing

• Nomdedomaine• Avoirsonproprenomdedomaine• En2012google aplacéunfiltredenettoyage«EMD »ExactMatchDomain• Quelnomdedomaineutiliser?• Quelhébergeur?• GoogleprendencomptelesdistancesdesadressesIP:liensentrelesdocuments• L’anciennetédudomaineestimportante

Page 31: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Critèresinpage

• Nomscomposés?• Tiretplutôtquecollerlesmots

• Nomdedomaine?• Motsclésounomdel’entreprise

• Communiquersurunseulnomdedomaine• Référencementinternational:• Plusieurssolutions:unnomdedomaineparpays,unsous-domaineparpays,unrépertoireparpays,pagesmultilingues(àéviter)

• URL:destermesclaires

Page 32: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Contenutextuel• Réfléchirmoteurderecherche• Laqualitéducontenuestimportante• Letextevisibleestanalyséparlemoteurderecherche• Lesoccurrencesdesmotsclés:commentdoser?• 1page=1requête• Lacassen’estpasimportante• Ordreetdistancedansletexte• Unseulthèmeparpage• Plusieurslangues?• Localisationdumot?• Avoirunerequêteprincipaletunchamplexical

• Lespositionnerdansles<hn>• Balise<strong>:pasdansle<hn>:peutêtrepénaliséparlesmoteurs

Page 33: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Contenutextuel

• Mettredesliensconnexes(ex:amazon)• Emplacementdesliens:pasloindutexte.Evitezleslien(suite,voirplus…)• Pasdelimitedenombredeliens:ilfautquecelarestelisible• Mettredesliensexternes• Untitrepaspage• Nomdusiteaudébutdelapaged’accueiletàlafindespagesinternes

Page 34: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Critèresoffpage

• Leslienssonttrèsimportantspourlesmoteursderecherche• Lesrobotssuiventleslienspourindexer• L’attributhref doitêtre100%valide• L’ancresertdethèmedanslapage(cohérencepourunbonpositionnement)• LeGoogleBombing :multipliersurlessitessourceslarequête• PagesavecunPRimportant• EviterimagesetJS

• Insérerl’attributalt dansimg• Eviterlesliensdanslesformulaires

• Priseencomptedeslienssortants?

Page 35: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Coconsémantique

• Stratégiedecréationdesitewebetd'arborescencequis'articuleautourde4grandesétapes• Nouveauconcept(2015) imaginéparLaurentBourrely1. Ladéfinitiondesrequêtesvisées,classéespargrandesfamilleset

besoinsdel'internaute.2. Créationd’unemindmap3. Lacréationdeliensinternesentrepagesmères,fillesetsœurs.4. L'optimisationdechacunedespages,auniveaudesbalisesetdela

contextualisation/sémantisationdesliens.

Page 36: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

PageRank

• Lesmoteurspopulairesutilisentl’indicedepopularité• Google:PageRank• Lapopularitédelapageetdespagesquipointentverselle• Lenombredeliensdanslapagepointante• Unpoidsplusfaiblepourlesliensinternes?• PRd’unepagepasd’unsite• Seulsleslienspointantverslapage• Toolbar suppriméenAvril2016• LePRnesuffitpas.Undes200critèresutiliséspargoogle :quelapopularitédelapage

Page 37: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

CalculdupageRank

• PR(A)=(1-d)+d(PR(T1)/C(T1)+...+PR(Tn)/C(Tn))

• PR(A)LesiteestreprésentéparA.• PR(Ti)àPR(Tn)estlePageRankdespagesTiàTn quipointentsurlesiteA.• C(Ti)àC(Tn)estlenombredelienssurlessitesTiàTn.

Imagewikipedia

Page 38: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires
Page 39: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Améliorersonindicedepopularité

• Ciblerdessitespopulaires• Evitezdetropéchangerdeliens:touslesliensnesontpaségauxdevantGoogle(liensdanslesfooter despages)• Deslienstriangulairesplutôtqueréciproques• Laqualitéplutôtquelaquantité• Lienspayants:formulairepourleswebmaster• Créerunechartedeliens• Suivrelesliens• L’attributnofollow

Page 40: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

TrustRank (indicedeconfiance)

Page 41: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Référencementmultimédia

Page 42: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Référencementdel’image

• Lenomdel’image• Leformatdel’image:gif,jpeg,png• Letextealternatif:descriptionsansaccents• Googleneprendpasencomptelongdesc (pasvalideenhtml5)

• Textedulien• Texteautourdelapage• Textedelapage

Page 43: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Référencementdevidéo

• Commentlesmoteurstrouventlesvidéos• Spiderclassique• L’internautechargedirectementlavidéo

• Optimisationdesvidéos• Lenomdufichier• Lesmétadonnées• Lescaractéristiquestechniques• Lestags• Laréputation• Letexteautourdelavidéo

Page 44: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Fichierpdf etword

Réussir son référencement web214

Zones reconnues par les moteurs de rechercheVoici les différentes zones que l’on peut « remplir » dans un fichier Word ou PDF etla façon dont Google et Bing les lisent ou non (notamment les « Propriétés »ou « métadonnées » que l’on peut fournir sur ces deux formats pour mieux décrire lesdocuments).

* Nous avons trouvé quelques cas isolés où Bing lisait la balise <title> du documentmais la plupart du temps, ce n’était pas le cas... Notons également que ces donnéespeuvent changer suite à l’accord entre Microsoft et Yahoo! (juillet 2009).

La situation est donc, ici, assez simple en termes de lecture des contenus et des métadonnéespar ces deux moteurs majeurs :

• Les deux moteurs lisent les contenus textuels des deux formes de fichiers.

Tableau 6-1 Champs pris en compte par Google et Bing pour des fichiers PDF

Google Bing

Contenu textuel OUI OUI

Métadonnée Titre (Title) OUI NON

Métadonnée Sujet (Subject) NON NON

Métadonnée Auteur (Author) NON NON

Métadonnée Mots-clés (Keywords) NON NON

URL OUI OUI

Tableau 6-2 Champs pris en compte par Google et Bing pour des fichiers Word

Google Bing

Contenu textuel OUI OUI

Métadonnée Titre (Title) OUI NON*

Métadonnée Sujet (Subject) NON NON

Métadonnée Manager NON NON

Métadonnée Auteur (Author) NON NON

Métadonnée Compagnie NON NON

Métadonnée Category NON NON

Métadonnée Mots-clés (Keywords) NON NON

Métadonnée Commentaires (Comments)

NON NON

URL OUI OUI

Page 45: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

SMOSocialMediaOptimisation

Page 46: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Réseauxsociauxpourleréférencement

• Commentprofiterdesréseauxsociauxpourleréférencement?• Inciterlesvisiteursetinternautesàdiffuserl’information• Twitter,FacebooketGoogle+:réseauxsociaux « stars »• Ilsontdesliensnofollow :invisiblespourlesmoteursderecherche

Page 47: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Réseauxsociauxpourleréférencement

• Lesétudessebasentsurlacorrélationetnonlacausalité• Lesréseauxsociauxcommeunesourced’analyseetdedétéction depages• J’aime,followers…nesontpasprisencompte• SEO/SMOcomplémentaires

Page 48: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Visibilitédanslesmoteursderecherche

Page 49: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Plusdevisibilté

• Pourunepagedéjàpositionnée:• Confianceauxauteurs(jusqu’en2014affichagedel’auteur)• Richsnippets :RDFa,microdata,JSON-LD(Websémantique)• Schema.org• Knowledge Graph:combinaisondeschema.org etdeprofileGoogle+

Page 50: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Spamsetpénalités

Page 51: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Anepasfaire

• Lecloaking :autrecontenu• Lecontentspinning :ducontenusansledupliquer• Lescraping :récupérationdecontenu

Page 52: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Pénalités

• Sandbox :quarantaine• Blacklist• Déclassement• Unformulairede« reconsidération »

Page 53: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Nepasêtreréférencé

Page 54: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

• Balise<meta>• Pour empêcherlaplupartdesmoteursderecherche :• <meta name="robots"content="noindex">

• Pourn'empêcher quelesrobotsd'explorationGoogle• <meta name="googlebot"content="noindex">

• pages confidentielles• pagesenmaintenance• pagesendouble• pagesquin’ontpasd’importanceréelle

Page 55: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires
Je
Page 56: Référencement Webufrsciencestech.u-bourgogne.fr/master1/CWA/referencement.pdf · Le référencement naturel •Premiers moteurs de recherche : •Yahoo : un des premiers annuaires

Références

• Réussirsonréférencementweb- Edition2018-2019:StratégiesettechniquesSEO.OlivierAndrieu