i motori di_ricerca_1
DESCRIPTION
Comprendere i motori di ricerca ed il webTRANSCRIPT
InternetI motori di ricerca
Panoramica su internet, dati, metadati, strumenti di ricerca ed altro.
Sommario
● Dati, metadati, indici, versioni del web, il web semantico
● I motori di ricerca, i motori di ricerca semantici, i meta-motori di ricerca
● Interventi SEO● Dettagli: influenzare i bot, ottimizzazione
dei tag e metatag● Attendibilità dei risultati
Dati, metadati ed indici
Dal dato al meta-dato e ritorno...
I dati nel world wide web
Le "versioni" del web
Nella sua prima "versione" il web era stato concepito come una vetrina in cui contenuti, prodotti da specialisti, potessero essere pubblicati per essere fruiti dalle masse...
Il web come lo conosciamo oggi
...Il web 2.0...
Il web presente e quello futuro.
Il web 3.0
Facciamo ordine: i motori di ricerca
La ricerca semantica
La collezione dei dati
I motori di ricerca costituiscono le proprie banche di meta-dati utilizzando speciali "agenti" chiamati anche "spiders", "bots" o "webcrawlers".
Questi programmi specializzati leggono le pagine web dei siti seguendo i links che le collegano.
Gli "snapshot" delle pagine (Circa 100 kb testuali), vengono aggiunte all'archivio di metadati del motore di ricerca.
Gli spiders detti anche bot o robot passano di link in link catturando le pagine.
Ai metadati viene applicato un algoritmo che ne calcola il peso di pertinenza e la posizione nell'indice: i risultati di una ricerca vengono poi restituiti in ordine di rilevanza.
I meta-motori di ricerca
Il flusso dei meta-motori
dalla documentazione di metasearch.com
Influenzare il posizionamento
La SEO è quell'attività di ottimizzazione che i webmaster compiono per rendere i siti più "digeribili" per i motori di ricerca.
Search Engine Optimization
Dettaglio: Influenzare i bot
Gli "spiders" scansiscono le pagine a partire da un link o dall'url ricevuto come indicazione dal webmaster.
Il webmaster può "dialogare" con i robots mediante appositi strumenti:
● Il form di richiesta di indicizzazione del motore di ricerca.
● Il file sitemap.xml ● Il file robots.txt
Esempio di sitemap.xml<?xml version="1.0" encoding="UTF-8"?><urlset mlns="http://example.com/sitemap/0.9"> <url> <loc>http://example.com/</loc> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url></urlset>
Esempio di robots.txt
# robots.txt per http://example.com/ diniego per tuttiUser-agent: * Disallow: /cyberworld/map/ # Spazio da non indicizzare
# Solo al bot cybermapper è permesso indicizzare.User-agent: cybermapper Disallow:
Dettaglio: Ottimizzare tag e meta-tag
Il seguente è un esempio di intestazione di una pagina web contenente i "meta-tag" ed i "tag" più indicativi per i motori:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//IT" "http://www.w3.org/TR/html4/loose.dtd"><html><head><META NAME="Description" CONTENT="Autore: A.N. Autore, Illustratore: P. Picture, Categoria: Libri, Prezzo: £9.24, Lunghezza: 784 pagine"><META http-equiv="Content-Type" CONTENT="text/html; charset=iso-8859-1"><META NAME="google-site-verification" CONTENT="+nxGUDJ4QpAZ5l9Bsjdi102tLVC21AIh5d1Nl23908vVuFHs34="/><title>Esempi di libri: libri usati di alta qualità per bambini</title><META NAME="robots" CONTENT="noindex,nofollow">
Riferimenti:sample header: cortesia di "Google Webmaster Documentation".
Attendibilità dei risultati
I motori di ricerca, forniscono come risultato delle nostre richieste dei collegamenti a delle pagine web; ma quanto sono attendibili le pagine risultanti?
E' possibile influenzare in modo "malevolo" le determinazioni dei motori di ricerca?
Q&A
Grazie per l'attenzione