operatori booleani e metodologia per la ricerca ... · questa sezione propedeutica ci ... and...
TRANSCRIPT
Corso:Banche Dati e sistemi per l’informazione
e la valutazione della ricerca6-7 aprile 2016
Operatori booleani e metodologia per la ricerca
informativa con uso di parole libere
Fabio D’OrsognaFrancesca Servoli
Questa sezione propedeutica ci introdurrà all’utilizzo degli operatori
booleani su Google
Tutte le più
importanti banche
dati biomediche e
non solo
utilizzano gli
operatori booleani
per raffinare le
ricerche!
Quanti di voi hanno utilizzato Google per effettuare una ricerca?
Quanti di voi utilizzano o hanno mai utilizzato gli operatori booleani per
raffinare una ricerca con troppi risultati su Google?
A volte una ricerca troppo generica
può risultare poco efficace
Possiamo però aumentare la precisione della nostra
ricerca riducendo il così detto rumore...
...raffinando la nostra ricerca con l’aiuto degli operatori booleani che prendono il nome dal matematico che li teorizzò nell’Ottocento, George Boole, considerato
oggi il padre della logica matematica.
AND esegue il prodotto logico di due o più descrittori ottenendo risultati che contengono contemporaneamente i termini
correlati
L’operatore AND o moltiplicazione logica:
L’operatore OR o somma logica:
OR esegue la somma logica di due o più descrittori reperendo articolo che contengono o l’uno o l’altro o ambedue i termini
L’operatore NOT o sottrazione logica
NOT mi esclude i descrittori non pertinenti ai fini della mia ricerca
Cane AND gatto
Cane OR gatto
Cane NOT gatto
Ed ora facciamo un esercizio su
1. Cercare dei siti che parlino di cani e gatti2. Cercare dei siti che parlino di cani o gatti
3. Cercare dei siti che parlino di cani ma non di gatti
Altri operatori
Troncamento: permette di ricavare da una radice significativa tutte le varianti per quel termine (es. Canc* fa la ricerca su cancro, cancri, cancerogeno ecc. *fibrinogeno prende anche antifibrinogeno)
Simbolo = di solito un asterisco dove si tronca es: neoplas*
Mascheramento: nasconde una o più lettere all’interno della parola es. “Tumo#r” prende anche “tumour”
Il simbolo è di solito un cancelletto.
Adiacenza: ricerca due o più termini uno dietro l’altro. Es. “Tumore del polmone” recupera le parole in sequenza come
una frase. Ricerca cioè la frase completa e non le singole parole.
Simbolo = di solito “due virgolette”
L’operatore NEAR o di prossimità
E' un operatore di prossimita': relaziona due termini collocati nella stessa frase, indipendentemente dal loro ordine o dal numero di termini interposti.
Es. Inflammation near repair (tutte le citazioni che, contenendo i due termini presenti nella stessa frase, presumibilmente corrispondono ad articoli che trattano di correlazione tra questi due termini)
Variabilità degli operatorie dei simboli urtilizzati
• Non sempre sono presenti tutti gli operatori descritti, in alcuni casi può esserci solo l’AND. In alcuni casi vi sono altri operatori oltre quelli indicati.
• Alcuni simboli possono avere un significato diverso. Ad esempio l’asterisco * (o gli asterischi) in Google rappresenta un operatore di prossimità near e non il troncamento.
• I simboli con cui si indicano gli operatori possono cambiare a secondo del sistema in cui entriamo.
• Oltre l’asterisco è possibile trovare il segno di dollaro $ oppure la chiocciola @
• in alcuni casi se si scrive una radice questa viene automaticamente troncata es se scrivo neoplas la ricerca si svolge automaticamente anche su neoplasia, neoplasie, neoplastico…
Operatori di ricerca su Google
Riassumendo...
1. L’operatore AND usato per due o più termini aumenta o diminuisce il numero di record ricavati?
2. L’operatore OR aumenta o diminuisce il numero di record?
3. E il troncamento (*)?4. E l’operatore di adiacenza (“...”)?
Altri operatori, come ad esempio i caratteri jolly, non
esistono in Caratteri jolly
(*, $...)A differenza d
i
altri motori di
ricerca Google non
permette l’
utilizzo di
questo sistema che
coinvolgerebbe una
quantità troppo
elevata
Strategia di ricerca di base
• Scrivi una frase che esprima la ricerca, ad esempio:
« Cerco articoli che riguardino i disturbi del sonno legati ai trattamenti chemioterapici»
• Dividi il soggetto in concetti essenziali
(es. disturbo del sonno, chemioterapia)
• Cerca i termini o i descrittori MESH che rappresentino i concetti essenziali
• Una volta individuati i concetti essenziali della ricerca è possibile combinarli con gli operatori booleani
I sinonimi in
Scrivi: ~child Trovi: i sinonimi, le parole affini (family, kid, young ecc…)
Come si digita la
tilde? (~)
Tieni premuto il
tasto ALT
numerica e
contemporaneamente
digita 126
dalla tastiera
*
Google manda in pensione la tilde (“~”)Pochi la conoscono e pochissimi l’hanno utilizzata, ma fino a poco tempo fa la tilde (“~”) era un
carattere che permetteva di rendere più complete le informazioni restituite dal motore di ricerca di Mountain View in seguito alle query; ora questa feature è stata rimossa e non verrà più presa in considerazione dall’algoritmo di Big G.
In pratica, posizionata davanti ad una parola da ricercare su Google, la tilde consentiva di accedere a tutti i suoi sinonimi, essa rappresentava quindi una sorta di chiave semantica grazie alla quale individuare tutte le alternative utilizzabili in luogo di un determinato termine.
La tilde, che come anticipato veniva adottata da un numero estremamente ristretto di utenti, si rivelava invece uno strumento particolarmente utile per i Webmasters e gli esperti di Search Engine Optimization, questo per via del fatto che essa permetteva di capire le dinamiche messe in moto dall’algoritmo di Google per associare tra loro le differenti keywords.
Comunicandone il “pensionamento”, i portavoce di Big G hanno fatto riferimento al suo scarso utilizzo per motivarne l’eliminazione; l’operatore dismesso si sarebbe dimostrato con il tempo un elemento eccessivamente complesso da gestire; essendo impiegato da una parte minoritaria degli utenti, un ulteriore investimento per la sua implementazione non sarebbe stato giustificabile.
La tilde non è più disponibile neanche attraverso l’Help Center di Larry Page e soci, per cui una ricerca effettuata tramite una chiave preceduta da tale operatore produrrà lo stesso risultato possibile in sua assenza.
Pubblicato il 25 giugno 2013
La ricerca avanzata su GoogleSe lanciando una ricerca si ottengono troppi risultati è possibile raffinarla mediante
una ricerca avanzata. Partendo menù verticale della rondella in alto a destra
selezionare Ricerca avanzata
Altre opzioni
Nella schermata di ricerca avanzataPossiamo compilare i campi disponibili invece
di utilizzare gli operatori booleani
Gli operatori booleani su Scopushttp://goo.gl/fEorne
http://images.webofknowledge.com/WOKRS520B4.1/help/WOK/hs_search_operators.html#dsy863-TRS_search_operator_precedence
Searching the Organizations - Enhanced FieldSearch for preferred organization names and/or their name variants from the Preferred Organization Index.Enter complete names or partial names using wildcards (* $ ?). When searching for multiple preferred names or multiple name variants, separate the names using the OR Boolean operator.
Booleans in Organization NamesWhen searching for organization names that contain a Boolean (AND, NOT, NEAR, and SAME), always enclose the word in quotation marks ( " " ). For example:
● (Japan Science "and" Technology Agency (JST))● ("Near" East Univ)● ("OR" Hlth Sci Univ)
You can also enclose the entire query in quotation marks. For example:● "Japan Science and Technology Agency (JST)"● "Near" East Univ"● "OR Hlth Sci Univ"
Search Field versus Search Aid ResultsTyping a name variant in the search field does not always return the same number of results as selecting a name variant from the search aid.For example, entering the variant Columbia Coll in the search field returns all records that contain Columbia Coll anywhere in the Addresses field.Entering Columbia Coll in the Find field in the search aid displays the preferred name Columbia University in the selection list. A search on this name returns records containing the preferred name and records containing the variant.
Organization-Enhanced ExamplesA search on a preferred organization name returns all records that contain the preferred name and all records that contain its name variants. For example,Cornell University returns all records that contain the preferred name (Cornell University) and all records that contain a variant, such as:
● Caltech, Dept Astron, Pasadena, CA 91125 USA● Univ Calif Berkeley, Dept Astron, Berkeley, CA 94720 USA● Cornell Univ, Dept Astron, Ithaca, NY 14853 USA
A search on a name variant returns all records that only contain the variant. For example, Cornell Law Sch returns all records that contain Cornell Law Sch in the Addresses field.
Web of ScienceTM Core Collection Help
Esercitazione
Ricercare su Google
via Milano a Torino
Conoscete o avete mai utilizzato Google Scholar per le
vostre ricerche?
Google Scholar permette di effettuare un'ampia ricerca sulla letteratura accademica. E’ possibile effettuare ricerche tra molte discipline e fonti:
documenti approvati per la pubblicazione, tesi, libri, abstract e articoli di case editrici accademiche, ordini professionali, database di studi non
ancora pubblicati, università e altre organizzazioni accademiche.
Come vengono classificati gli articoli?Google Scholar mira ad elencare gli articoli in base alla stessa classificazione
adottata dal mondo scientifico, ossia valutando il testo completo di un articolo, l'autore, la pubblicazione in cui è riportato e il numero di volte in
cui viene citato in altri documenti accademici. I risultati più pertinenti vengono sempre visualizzati nella prima pagina.
Limiti: contenuti e qualità?
Non si hanno dati sulla copertura:
Quante e quali riviste?
Quanti e quali libri?
Quante e quali tesi?
In molte aree di ricerca le versioni di un lavoro possono apparire
come documenti precedenti alla pubblicazione oppure relazioni
di conferenze prima di essere pubblicate come l'articolo di una
rivista. Queste versioni preliminari di un lavoro sono spesso
citate in aggiunta alla versione definitiva della rivista.
Il numero di citazioni di un determinato lavoro è importante per
determinarne la classificazione tra i risultati della ricerca in
Google Scholar. Il raggruppamento delle versioni ci consente di
raccogliere tutte le citazioni di tutte le versioni di un lavoro. In
pratica questo può notevolmente migliorare la posizione di un
articolo nei risultati di ricerca.
Diverse versioni di un lavoro scientifico
• Documenti precedenti alla pubblicazione (es. manoscritti prima della revisione tra pari).
• Relazioni di conferenze prima di essere pubblicate come l'articolo di una rivista.
• Queste versioni preliminari sono spesso citate in aggiunta alla versione definitiva della rivista.
• In Google Scholar il raggruppamento delle versioni consente di raccogliere tutte le citazioni di tutte le versioni di un lavoro.
Google Scholar collabora anche con le biblioteche
E’ possibile configurare il Linksolver su Google Scholar in modo da permettere l’accesso ai
documenti cui si ha diritto (es. Bibliosan)
In tal modo si disporrà direttamente su Google dei testi interi di articoli che si sono sottoscritti
Esempio di citazione da Google Scholar
Archivi aperti
Google Scholar permette il recupero di documenti da archivi aperti ed istituzionali
disponibili liberamente su Web
Proviamo a fare un ricerca!
Inseriamo su Google Scholar
la parola Cancro
Elenco di risultati inserendo la parola Cancro
La ricerca per parola libera:
Non risolve le ambiguità: cancro malattia, segno zodiacale o tropico del
cancro?Nel caso della malattia non mi permette inoltre di ricercare i
singoli tipi di cancro es. Mieloma, leucemia…
https://scholar.google.it/intl/it/scholar/help.html
Esercitazione
Trovare in Google Scholar
una tesi pubblicata nel 2010
sulla storia del gruppo musicale R.E.M. (1983-1993)
Esercitazione
Cercare su Google Scholar documenti relativi a studi in vivo ad esclusione di quelli
che trattino anche di studi in vitro
Il più davanti una stop word la rende ricercabile