búsquedas de información
Post on 07-Feb-2017
34 Views
Preview:
TRANSCRIPT
Búsquedas y recuperación de información
Tabla de contenido• Búsquedas en Google
o Generalidadeso Operadores booleanoso Operadores soportadoso Calificadores de términoso Otros calificadores y algunos especialeso La búsqueda avanzada de Googleo Opciones de personalización en Googleo Búsqueda de imágenes en Google con características concretas o Visualización de resultados
• Independiente del motor de búsqueda• Metabuscadores• La internet invisible o Web profunda• Evaluación de los recursos de información• ¿Cómo usamos la información?• Algunas fuentes de información fiables• Ejercicios y ejemplos
Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales 1
Búsquedas en Google
2Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
Búsqueda normal
Generalidades• Mayúsculas y minúsculas son indistintas• Ignora los signos de puntuación o signos diacríticos• Se deben introducir consultas sencillas• Google buscará resultados con todas las palabras que se pongan. Se deben poner sólo palabras específicas y significativas. (Independiente del motor de búsqueda)• Google puede incluir sinónimos• Se deben evitar palabras vacías (Google ignora artículos, preposiciones o conjunciones)• Se pueden definir búsquedas con operadores booleanos
3Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
Búsqueda normal
Cadena de palabras“frase”
• Buscar una frase exacta, o una persona con nombre y apellidos, o un título de un libro o documento, etc.
4Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
Búsqueda normal
Espacios en blanco
*•El asterisco sustituye a alguna palabra que no conocemos, no sabemos como se escribe o pueda
estar en singular o plural•Término_1*término_2: entre ambos términos
debe aparecer una o más palabras.
5Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
Búsqueda normal
Operadores booleanos
AND (debe ir en mayúsculas)
• Si queremos que aparezcan los dos términos
• Así reducimos los resultados de nuestra búsqueda
• Término_1 término_2 (se entiende cómo si llevara el AND y deben estar los
dos términos en el documento recuperado)
6Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
Búsqueda normal
Operadores booleanos
OR (mayúsculas)
• Si buscamos una página dónde al menos aparezca uno de los dos términos
• Normalmente pondremos sinónimos
• Así ampliaremos el número de resultados
• Término_1 OR término_2
7Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
Búsqueda normal
Operadores booleanos
• Para buscar un términos que NO aparezca junto a otro:
NOT (mayúsculas)
NO (mayúsculas)
-‐ (para google)
• Términos_1 –término_2 (debe aparecer el primer término pero no el segundo) (Ej.: uso doméstico
-‐herramientas)
• Término_1 NO término_2 (debe aparecer el primer término pero no el segundo)
• Ej.: intitle: ”historia local”intitle:Guadalajara -‐México -‐Jalisco
8Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
Búsqueda normal
Operadores soportados• Término_1 término_n: recupera textos dónde están los dos términos, seguidos y en el orden especificado (búsqueda de frases, equivalente a ADJ1). Recupera también
expresiones que incluyen: -‐, /, ., ‘, =).
• Término_1*término_2: una o dos palabras, ambos términos. Ej. Quien*anda (observar los resultados sobre “quien mal anda…”)
• límite_inferior..límite_superior: permite la búsqueda de cualquier número comprendido en el rango determinado por los límites inferior y superior expresados. Ej. 1998..2002 (observar los resultados: 1999, 2001, etc.)
9Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
Búsqueda normal
Calificadores de términos• Escribir el signo + delante del término requerido
• +término: (energía+solar (obliga a que esa palabra aparezca en el sitio web))• Fuerza la búsqueda de una palabra vacía, letras y dígitos sueltos
• Fuerza la búsqueda de la palabra con los diacríticos expresados • Desactiva la búsqueda de sinónimos.
• Site:[[]]: documentos en un sitio web o dominio de primer nivel <org>. Ej. ‘site:org’; ‘Becas site:uc3m.es’; ’site:www.uc3m.es’
• filetype:formato: busca documentos en un formato (.pdf, .ps, .rtf, .doc, .xls, .ppt, .swf, etc.).
• intitle:término: busca sólo (o excluye precedido de “-‐”), documentos que tengan el término (o frase) en el título. • allintitle:término_1término_n (permite buscar en el título una serie de términos). Ej. allintitle:fundación carolina (busca páginas web que en su
título contenga todas esas palabras)
• intext:término: busca sólo (o excluye precedido de “-‐”), documentos que tengan el término (o frase) en el texto. • allintext:término_1término_n (permite buscar en el texto una serie de términos). Ej. Allintext:fundación carolina (busca páginas web que en su
texto tenga todas estas palabras) Ej. Intitle:universidad intext:becas(busca páginas web que en el título tengan la palabra “Universidad” y en el texto aparezca “becas”)
10Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
Búsqueda normal
Calificadores de términos• inurl:término: busca sólo (o excluye precedido de “-‐”), documentos que tengan el término (o frase) en la URL del documento.
• allinurl: término_1término_n (permite buscar en la URL una serie de términos). Ej. Allinurl:alumnos becas (busca páginas web que en su URL contenga todas esas palabras); inurl:becas intitle:becas (busca páginas web que tanto en su URL como en su título contengan la palabra “becas”)
• inanchor:término: busca sólo (o excluye precedido de “-‐”), documentos que tengan el término (o frase) en la URL del documento o cualquier ancla (<a> en HTML), que lleve a la página desde cualquier otro documento.
• allinanchor:término_1término_n [en este caso la palabra no tiene por qué estar en la página recuperada. Esto se ha aprovechado en ciertas campañas satíricas para asociar una determinada expresión con una determinada página web, en lo que se ha denominado “Google bombing”. Así en determinados momentos, buscando “ladrones” salía como resultado principal la página de la SGAE, aunque en la página no aparecía la palabra buscada; el primer caso mundialmente conocido asociaba “miserable failure” con el expresidente norteamericano George W. Bush en 2006]
• P. ej. Allinanchor:universidad carlosIII (localizaría páginas que tuvieran un ancla con el texto, por ejemplo, “Universidad Carlos III de Madrid”, independientemente de si está asociada al URL http://www.uc3m.es o cualquier otro. Quizá ya no mantenga la opción porque en muchas ocasiones nos encontramos con anclas poco significativas, del tipo “pinche aquí”)
11Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
Búsqueda normal
Otros calificadores (no combinables entre sí)
• info:URL (Da información sobre la página cuyo URL se especifica)
• define:término (Busca documentos que contengan una definición del término dado)
12Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
Búsqueda normal
Otros calificadores especiales
• link:URL (Muestra las páginas que contienen en alguno de sus enlaces el URL (o fragmento de
URL) especificado. Por ejemplo, link:www.uc3m.es mostrará todas las páginas que señalan la
página principal de la Universidad Carlos III de Madrid. No se puede combinar una búsqueda link:
con una búsqueda de palabra clave normal)
• related:URL (recupera páginas con contenido similar a aquella cuyo URL se proporciona).
[Por ejemplo, si la página de inicio es la página principal de una universidad, devolverá las páginas
principales de otras universidades; si la página es de un departamento de ingeniería, encontrará
departamentos de ingeniería en lugar de universidades. Se supone.]
13Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
Búsqueda avanzada de Google
Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales 14
Búsqueda avanzada
• El formulario de búsqueda avanzada permite especificar criterios de búsqueda de una manera fácil, pero en realidad limita algunas funcionalidades que se pueden alcanzar desde la interfaz de búsqueda simple. Muchas de las opciones que nos permite este formulario pueden usarse desde la interfaz de búsqueda simple, con unas pocas excepciones:• Incluir sólo documentos en una lengua dada.• Incluir sólo documentos en una “región”. (País) (no equivale a site:tld_país). La adscripción a un país está
determinada por la ubicación física de la dirección IP de servidor que alberga la página, no por el dominio administrativo de código de país (ccTLD). En 2010 estas opciones han pasado a ser 3 enlaces cuyas anclas están en el panel de la izquierda (una vez hecha la consulta) en “Herramientas de búsqueda”: “cualquier país”, “cualquier idioma” y “cualquier fecha”
• Incluir sólo documentos actualizados recientemente. (También en el panel de la izquierda).
• Incluir sólo documentos sometidos a ciertos “derechos de uso”, con las opciones sin filtrar (cualquier documento), o sólo documentos de uso libre, de uso libre incluso comercial, de modificación libre y de modificación libre incluso con fines comerciales.
15Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
Opciones de personalización de Google
Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales 16
Opciones de personalización
• Desde la página de Google, abajo a la derecha en “Configuración”, pulsamos “Ajustes de búsqueda”. Opciones para usuarios no registrados:• Resultados de búsqueda:
• Activar el filtro de SafeSearh de pornografía• Determinar el comportamiento de las “Predicciones de Google Instant”(sugerencias de búsqueda mientras se escribe)
• Fijar el nº de documentos hallados que se puedan presentar por página• Establecer si al pulsar sobre los resultados deben mostrarse en una nueva ventada o pestaña
• Historial de búsqueda: desactivar o editar para usuarios registrados que hayan iniciado sesión. [En relación a las críticas sobre intromisión en la intimidad].
• Idiomas: elegir la lengua de la interfaz y de los documentos hallados• Ayuda de Google
17Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
Búsqueda de imágenes en Google con características concretas
• Para que sea más visual se proporciona un ejemplo en página 39 de este mismo documento.
• (En el cuadro de búsqueda se introduce “Crowded House”, se pulsa el botón “Imágenes” (en el menú debajo del cuadro de búsqueda), se pulsa “Herramientas de búsqueda” y con este se habilita otro menú dónde se puede especificar tamaño, color, tipo, fecha, derechos de uso, todos los tamaños o mostrar tamaños).
Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales 18
Visualización de resultados
Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales 19
Visualización de resultados
• Documentos indizados o referenciados por el motor de búsqueda
• Muestra el número de documentos encontrados y de cada uno• Título o URL (si no tiene título o el documento no está indizado)
• Extractos del texto con términos de búsqueda en contexto y negrita
• Orden de visualización: Los documentos se presentan antes, si:• Están muy referenciados por otros (PageRank):
o según el nº de referencias procedentes de otras páginas y
o según el nº de referencias de estas últimas
• Los términos de búsqueda están próximos
20Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
Visualización de resultados
• Si en el mismo sitio web se encuentran varios documentos• El segundo en relevancia se encuentra sangrado• Los restantes se agrupan bajo un enlace que remite a ellos
• Permite el acceso a una copia del documento en la BD de Google (enlace “cached” o “en caché”)• Incluye una cabecera indicando que es una copia• No actualizada, corresponde al momento de la indización (indicado en la cabecera)• Existe sólo si el propietario no prohíbe su almacenamiento y no solicita su borrado• Útil si no se tiene acceso al original (caída del servidor o borrado del documento)• Los términos de búsqueda están resaltados en distintos colores
21Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
Visualización de resultados
• Permite el acceso a páginas similares o relacionadas (enlaces “similares”)• Puede mostrar un sólo documento por búsqueda, supuestamente el más relevante, usando el botón “I’m Feeling Lucky” o “Voy a tener suerte”• Una búsqueda puede remitir directamente a un mapa, si la búsqueda se reconoce como una dirección postal• Su interfaz de búsqueda simple puede usarse también como una calculadora, un conversor de monedas o medidas, etc.
22Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
Independiente del motor de búsqueda
23Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
Características de búsqueda (casi) independientes del MB
• Escribir el signo + delante del término requerido• +termino: (energía+solar (obliga a que esa palabra aparezca en el sitio web))• Fuerza la búsqueda de una palabra vacía, letras y dígitos sueltos • Fuerza la búsqueda de la palabra con los diacríticos expresados • Desactiva la búsqueda de sinónimos.
• Escribir el signo -‐ delante del término que se quiera excluir• “entrecomillar expresiones” que se quieran recuperar tal cual• Combinar +, -‐, “” si es preciso• Necesidad de que la búsqueda sea muy específica para obtener menos resultados
24Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
Metabuscadores
• Buscan en distintos motores de búsqueda a la vez.
• Aprovechan la similitud de sintaxis del lenguaje de búsqueda de los distintos motores de búsqueda. Ej.:
• http://www.metacrawler.com/• Busca en la web imágenes, audio, video, en Google, Yahoo!, Yantex y algunos más. Cambia con frecuencia según los motores
permiten su uso por parte de los metabuscadores o no.• ¿Cómo funcionan? Se plantea una búsqueda, se envía a esos buscadores, reúne resultados, elimina duplicados, hace un control de
relevancia y ofrece una lista exhaustiva de recursos.• Puede usarse desde dos interfaces:
• Búsqueda simple: expresión de búsqueda -‐ en un formulario-‐con un único campo de texto -‐ indicando sólo tipo de recurso buscado -‐ (página web, imágenes, video,…). Además de la búsqueda de páginas web, permite la de imágenes, video, noticias, páginas amarillas y blancas.
• (Búsqueda avanzada: a cambiado la interfaz y dirige hacia http://msxml.excite.com/)
• https://www.zapmeta.com• Según su página principal busca en: Yahoo, Microsoft Bing, You Tube, Wikipedia, Entiriweb, etc. Pero en la lista de resultados no
indica de que fuente procede cada uno.• Ofrece 2 interfaces: búsqueda simple o avanzada
25Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
La internet invisible o Web profunda
• Los motores de búsqueda (como Google), no indizan todo lo que es accesible a través de la web. Toda esa información que no está indexada por los buscadores es muchísima: catálogos, bases de datos,… Recibe el nombre de “La web invisible”, recursos inaccesibles para los motores de búsqueda.• Según algunos autores se indiza menos del 1%. Esto es la llamada “web visible”
26Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
Evaluación de los recursos de información
Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales 27
Evaluación de los recursos de información
• Publicar contenidos en la web es una tarea fácil, barata y libre. Noestá regulada ni monitorizada.• Internet proporciona la capacidad de expresarse, comunicarse y relacionarse libremente, intercambio de ideas y conocimiento con personas del mundo entero. Esta es la revolución más importante después de la revolución industrial.• Esto conlleva disparidad en cuando a tipología, finalidad, fiabilidad, rigor y en definitiva, calidad de la información.• Por tanto, es necesario evaluar lo que se encuentra en la web.• Se debe evaluar la validez, la autoría, la actualización y la integridad de lo que encontramos.• Recursos fiables: .edu, .org, …
28Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
Evaluación de los recursos de información
Preguntas que se deben hacer• ¿Quién escribió la página?
• Busca el nombre del autor, o de la organización, institución u organismo responsable de la página. (CUIDADO: un correo electrónico de contacto no es suficiente).
• Si no se proporciona el nombre de ningún autor personal, se busca una agencia y organización que asuma la responsabilidad de la página.
Si no se puede encontrar el nombre de ningún responsable, se trunca el URL hasta encontrar mención de responsabilidad o editor. ¿El editor reclama la responsabilidad sobre el contenido?¿Explica por qué existe la página?
• ¿Está fechada la página? ¿Es lo suficientemente actual?• ¿La información proporcionada es “obsoleta” sobre un tema sensible al tiempo o en evolución?
• ¿Cuáles son las credenciales del autor sobre este tema?• ¿Tiene el autor la formación, experiencia y conocimiento adecuados que le cualifican para escribir sobre el tema?• Se deben buscar credenciales pertinentes y convincentes, observa muy de cerca las fuentes de documentación que se citan
o proporcionan.
Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales 29
Evaluación de los recursos de información
Preguntas que se deben hacer• ¿Son fuentes documentales con notas al pie o enlaces?• ¿De dónde obtuvo la información el autor? (se debe citar la documentación e información empleada)• Si hay enlaces a otras páginas, ¿se trata de fuentes de confianza?• ¿Funcionan los enlaces?
• ¿Hay enlaces a otros recursos sobre el tema? • ¿Los recursos están bien elegidos, organizados y/o evaluados y anotados?• ¿Funcionan los enlaces?
• Recursos fiables: dominios tipo (.edu, .org,…)
Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales 30
¿Cómo usamos la información?
Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales 31
¿Cómo usamos la información?
• Habitualmente con corta/pega• En ocasiones reelaboramos utilizando sinónimos• Plagio y sus repercusiones: https://competenciaseninformacion.wordpress.com/• Herramientas para detectar el plagio hay muchas. Por ejemplo: Turnitin,…
Algunas fuentes de información fiable online
Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales 33
• Movimiento Open Acces• Google académico / Google books• WorldCat• Khan Academy• DOAJ / DOAB• Repositorios (Riuma, e-‐Archivo,..)• Recolectores (Recolecta,…)• TRD y Teseo para Tesis Doctorales• Bases de datos especializadas,…
Ejercicios y ejemplos
Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales 35
Nos formulamos preguntas:
AND
Concepto 2
fumar
OR
tabaco
OR
nicotina
….
AND
Concepto 3
adolescentes
OR
jóvenes
OR
juventud
…
Concepto 1
depresión
OR
salud mental
OR
estado de ánimo
• Queremos saber (pregunta científica): ¿Qué conexión existe entre la depresión y otros trastornos psicológicos con el hábito fumador entre la población adolescente en países desarrollados?Ecuación de búsqueda: (depresión OR “salud mental” OR “estado de ánimo”) AND (fumar OR tabaco OR nicotina) AND (adolescentes OR jóvenes OR juventud)
36Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
En la siguiente tabla, a partir de una pregunta de investigación, trata de formular una ecuación o sentencia de búsqueda siguiendo el modelo del ejemplo anterior.
Concepto 1
OR
ORAND
Concepto 2
OR
ORAND
Concepto 3
OR
OR
37Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
• Ej.: intitle: ”historia local”intitle:Guadalajara -‐México –Jalisco (si se realizara una búsqueda más genérica sobre Guadalajara (Provincia) se obtiene información más específica de la capital. Si buscamos en una base de datos bibliográfica sobre temas históricos, se restringe el contexto de la búsqueda a disciplinas concretas, así como el tipo de fuentes de información: trabajos académicos. La indización previa de estos documentos y funcionalidades avanzadas de la base de datos me permite especificar de forma precisa cuáles son los temas o materias de mi consulta, a qué me refiero con Guadalajara (ciudad de Guadalajara en España) e indicar que ese topónimo es un tema, no el lugar de publicación del trabajo o de afiliación del autor.
38Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales
Ejercicio:
• Buscando en la base de datos de imágenes de Google, ¿Cuántas fotografías a todo color y de más de 6 megapíxeles hay aproximadamente sobre el grupo “Crowded House”? (Recuerda entrecomillar el nombre del grupo).
a) Más de 1.000
b) Entre 1.000 y 5.000
c) Entre 5.000 y 10.000
d) Entre 10.000 y 50.000
e) Entre 50.000 y 100.000
f) Más de 100.000
Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales 39
Ejercicio:• Buscando en Google documentos PDF que traten sobre astronomía o astronomy y que procedan de cualquier servidor web de la UC3M salvo ocw.uc3m.es
Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales 40
Ejercicio:
• Buscando en Google, ¿cuántos documentos hay aproximadamente en el dominio edu.es que traten sobre XHTML?
a) Entre 500 y 1000
b) Entre 1.000 y 5.000
c) Entre 5.000 y 10.000
d) Entre 10.000 y 50.000
e) Entre 50.000 y 100.000
f) Más de 100.000
Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales 41
Bibliografía
• PACIOS LOZANO, Ana R., et al. Técnicas de búsqueda y uso de la información. Universidad Carlos III de Madrid, 2013.
Pilar Novas Pardeiro. Biblioteca San Agustín de los Negrales 42
top related