buscadores y metabuscadores

21
BUSCADORES Y METABUSCADORES. ¿Qué es un buscador? Es una herramienta basada en un software determinado que nos ayud encontrar coincidencias entre la información buscada y la que exi base de datos, para entregarnos el resultado ordenado bajo cierto forma de direcciones URL o !nculos a estas, lo que nos permitirá inmediatamente a las páginas" #e no encontrar alguna coincidencia notificará" #e modo que un buscador es, una página %eb pero eso no es todo& e principio, todos los motores de b'squeda ofrecen un esquema simil datos, programa de indi)ación, robot de b'squeda e interfa)" El robot o ara*a es el programa que cru)a la %eb moi$ndose de un documento a otro, descendiendo progresiamente a tra$s de los hiperenlaces " El programa de indi)ación se ocupa de indi)ar la i los millones de páginas %eb ubicadas en seridores conectados a l formando gigantescas bases de datos a las que acceden los usuario de la interfa) del buscador" Luego, sucede que a eces un sitio de b'squeda no alcan)a para cu expectatias por la energadura de la tarea que tenemos ante noso complejo de la b'squeda en s!" +uando ello ocurre, la solución pu acudir a un metabuscador " Los metabuscadores son sistemas cuyas interfaces facilitan que se usar arios motores de b'squeda al mismo tiempo" ct'an como inte que remiten las cuestiones a arios motores seleccionados, y reen respuestas, procesadas o no, al usuario" Una ariante de los metabuscadores son los multibuscadores , cuya original es anterior a la de estos y consiste en presentar en una las entanas de b'squeda de diersos buscadores" Ello se logra co fragmentos del código de los programas originales y ensamblándolo 'nica interfa) gráfica" Un ejemplo de multibuscador lo constituye siglas significan( -uscador en .nternet para la %eb en Espa*ol& e buscadores más eteranos en el mundo hispano" /ació a finales de cubrir la ausencia de sitios %eb que catalogasen y permitiesen bu en espa*ol" 3ero alrededor de ese sericio inicial de b'squeda de , se han ido creando buscadores de otro tipo de contenidos, cualq su formato 4productos, noticias, imágenes, subastas, etc"5" 6eamos entonces algunos ejemplos de buscadores y metabuscadores q pueden ser muy 'tiles a la hora de hacer una b'squeda en .nternet lgunos de los buscadores espa*oles e hispanos más conocidos son

Upload: alexdiggory14

Post on 06-Oct-2015

220 views

Category:

Documents


0 download

DESCRIPTION

Buscadores y Metabuscadores en la Web.

TRANSCRIPT

BUSCADORES Y METABUSCADORES.Qu es un buscador?Es una herramienta basada en un software determinado que nos ayudar a encontrar coincidencias entre la informacin buscada y la que existe en su base de datos, para entregarnos el resultado ordenado bajo ciertos criterios en forma de direcciones URL o vnculos a estas, lo que nos permitir acceder inmediatamente a las pginas. De no encontrar alguna coincidencia tambin lo notificar.De modo que un buscador es, una pgina Web pero eso no es todo; en principio, todos los motores de bsqueda ofrecen un esquema similar: base de datos, programa de indizacin, robot de bsqueda e interfaz.El robot o araa es el programa que cruza la Web movindose de un documento a otro, descendiendo progresivamente a travs de los hiperenlaces . El programa de indizacin se ocupa de indizar la informacin de los millones de pginas Web ubicadas en servidores conectados a la red formando gigantescas bases de datos a las que acceden los usuarios a travs de la interfaz del buscador.Luego, sucede que a veces un sitio de bsqueda no alcanza para cubrir las expectativas por la envergadura de la tarea que tenemos ante nosotros o lo complejo de la bsqueda en s. Cuando ello ocurre, la solucin puede ser acudir a un metabuscador .Los metabuscadores son sistemas cuyas interfaces facilitan que se puedan usar varios motores de bsqueda al mismo tiempo. Actan como intermediarios que remiten las cuestiones a varios motores seleccionados, y reenvan las respuestas, procesadas o no, al usuario.Una variante de los metabuscadores son los multibuscadores , cuya idea original es anterior a la de estos y consiste en presentar en una sola pantalla las ventanas de bsqueda de diversos buscadores. Ello se logra copiando fragmentos del cdigo de los programas originales y ensamblndolos en una nica interfaz grfica. Un ejemplo de multibuscador lo constituye BIWE, sus siglas significan: Buscador en Internet para la Web en Espaol; es uno de los buscadores ms veteranos en el mundo hispano. Naci a finales de 1995 para cubrir la ausencia de sitios Web que catalogasen y permitiesen buscar pginas en espaol. Pero alrededor de ese servicio inicial de bsqueda de pginas Web , se han ido creando buscadores de otro tipo de contenidos, cualquiera que sea su formato (productos, noticias, imgenes, subastas, etc.).Veamos entonces algunos ejemplos de buscadores y metabuscadores que pueden ser muy tiles a la hora de hacer una bsqueda en Internet.Algunos de los buscadores espaoles e hispanos ms conocidos son:ALTAVISTAwww.altavista.comEs uno de los clsicos de Internet junto con el conocido Yahoo. Tiene una de las bases de datos ms extensas y precisas. Puedes encontrar prcticamente cualquier cosa que busques.

YAHOO ESPAAwww.yahoo.comVersin en castellano del famoso buscador Yahoo!. Este, al igual que su versin en ingls, contiene mucha informacin en sus servidores, gracias a los muchos aos de experiencia con los que cuenta. Es por ello en la actualidad uno de los ms utilizados y adems, proporciona correo gratuito a sus usuarios.

EUROSEEKwww.euroseek.comBuscador europeo con el que puedes encontrar muchas cosas. De creacin ms o menos reciente te permite buscar cosas en cualquier idioma europeo que te puedas imaginar. Desde el croata al estonio, pasando por cualquier idioma imaginable, incluido el esperanto. Una opcin muy recomendable.

EXCITE ESPAAwww.excite.esVersin en castellano del buscador norteamericano Excite. Bastante completo para bsqueda en castellano de informacin mundial.

LYCOS ESPAAwww.lycos.esTambin pertenece al grupo de los clsicos. En un principio no tena gran parte del mercado, pero con el tiempo ha ido colocndose en una gran posicin gracias a la mejora de sus servidores y a buscadores filiales como HOTBOT.

TERRAwww.terra.esPgina de Telefnica que surgi de la unin de diferentes buscadores clsicos en castellano, como fueron Ol, Oz, etc. Actualmente tiene muchos servicios a parte de los de buscador de informacin. Entre ellos estn el envo de mensajes a mviles gratuito, el acceso gratuito a Internet a traves del proveedor Terra o el servicio de correo electrnico gratuito. Una pgina muy completa, que no debes dejar de visitar.

ASTALAVISTAastalavista.box.skA pesar de no ser un buscador tradicional, no podamos dejar de lado a uno de los buscadores ms usados en la actualidad para encontrar cracks de programas. Porque queramos o no la piratera tiene un hueco grande en la sociedad actual y por tanto tambin en Internet.

EXCITEwww.excite.comEste es otro de los clsicos que se encuentran en Internet casi desde su comienzo. Es un buscador americano que ha tenido muy buenos resultados a nivel mundial por mucho tiempo.

HOTBOTwww.hotbot.comEs uno de los mejores. Pertenece a Lycos y resulta muy recomendable. Especialmente en la bsqueda de MP3s. Es capaz de encontrar cualquier artista, cancin o discografa que encontremos. Tras encontrarlo, nos clasifica los resultados, por ejemplo en el caso de la msica, nos lo clasificar por MP3s, discografas, pginas relacionadas, etctera.

WEB CRAWLERwww.webcrawler.comCon xito para bsquedas en Estados Unidos, pero con poca aceptacin en las relacionadas con la comunidad hispana y europea.

YAHOOwww.yahoo.comEste buscador, que hace unos aos lideraba a todos los existentes en esos tiempos, hoy en da sigue siendo el preferido de muchos y cada vez se modifica buscando mejoras y liderazgo. Aunque su diseo es algo anticuado (conserva el diseo original, huyendo de elementos grficos atractivos), este tiene muchsima informacin en sus servidores, gracias a los muchos aos de experiencia con los que cuenta. Adems proporciona correo gratuito a sus usuarios.

Veamos en la siguiente tabla algunos de los buscadores temticos ms utilizados, es decir aquellos especializados en un tema en particular o lo que es lo mismo que archivan informaciones especficas en sus bases de datos.NombreTemticaDireccin

Search ItBuscador de buscadoreswww.searchit.com

ArtQueArtewww.artque.com

WoYaaSobre fricawww.woyaa.com

Web-Agri.comAgriculturawww.web-agri.com

AcademicInfo.netBiologawww.academicinfo.net/biologysearch.html

SearchEngineColossusEducacinwww.searchenginecolossus.com/Academic.html

ScirusCienciawww.scirus.com

GOOGLEwww.google.comNo por ser el ltimo aqu es el menos importante, muy por el contrario Google es un buscador muy interesante. Podemos encontrar cosas que no se encuentran habitualmente. En las bsquedas precisas resulta muy efectivo, encontrando muchas de las cosas que le pedimos. Uno de los mejores que se puede encontrar, posiblemente es el mejor buscador global de la actualidad, e indudablemente, el ms popular; su actual base de datos excede los 4.000 millones de documentos, incluyendo pginas Web , archivos grficos, comunicaciones en Grupos de Inters, etc. Es extremadamente rpido, a pesar de atender 200 millones de consultas diarias. En su pgina inicial se puede elegir entre la bsqueda de sitios Web , de imgenes, de grupos de noticias o la navegacin por directorios. Por todo esto pensamos necesario incluir en este curso una leccin dedicada a la navegacin en Google.

Qu son los MetaBuscadores ?El objetivo de los Metabuscadores es facilitar al mximo y hacer ms eficiente la bsqueda de informacinEsto lo hacen buscando en mltiples sitios y entregandoun resumen de los artculos relevantes acerca del tema que se solicit, una diferencia entre ellos es la forma de buscar, los lugares en que buscan y como presentan la informacin.Los metabuscadores son herramientas de bsqueda que actan sobre algunos de los buscadores de informacin general ms conocidos. As dirigen las consultas a otros buscadores y presentan la totalidad de respuestas obtenidas. Es por ello que se usan para aquellas bsquedas en las que es interesante obtener el mximo de recursos disponibles en la red.A continuacin se presentan algunos ejemplos de metabuscadores .METABUSCADORNOMBREALCANCEIDIOMA(S)DIRECCIN

IxquickGlobalEspaolwww.ixquick.com

MetacrawlerGlobalInglswww.metacrawler.com

Ya.comGlobalEspaolwww.ya.com

Net PandoraGlobalEspaolwww.netpandora.com

Busca MultipleLocal (EUA)Espaol/Ingleswww.buscamultiple.com

7 SearchLocal (EUA)Inglswww.7search.com

MammaGlobalInglswww.mamma.com

DogpileGlobalInglswww.dogpile.com

Bsquedas en Internet

Bsquedas en la WebLos sistemas de bsqueda mas usados actualmente son los basados en pginas de hipertexto (servicio WWW) donde se introducen patrones o palabras clave a buscar. Estas pginas actan como intermediarias entre el usuario y una base de datos almacenada en el servidor o accesible para este. Algunos sistemas restringen la bsqueda al espacio WEB, pero la mayora permiten buscar cualquier tipo de recursos accesible mediante un URL.Los sistemas de bsqueda deben indexar en una base de datos propia parte de toda la informacin para no tener que recorrer toda la Red cada vez que se consulta. Los algoritmos utilizados en los programas de bsqueda se basan en estructurar la informacin de manera que optimice las bsquedas. El resultado es que los sistemas son prcticamente instantneos, aunque contengan millones de entradas.El usuario introducir una o varias palabras clave enlazadas entre s por operadores booleanos y el motor le buscar las concurrencias de esas palabras en las pginas fuente. Se establece seguidamente una clasificacin de las pginas ms pertinentes y se presenta finalmente una lista de enlace hacia dichas pginas. Operador Y:permite indicar que la bsqueda se realizar sobre las dos palabras introducidas, obligatoriamente. Si un documento contiene solo una de las dos palabras deseadas, no se tendr en cuenta en el resultado final. Suele simbolizarse por el operador AND o tambin el signo +. Operador O:permite indicar al motor de bsqueda que debe tener en cuenta las pginas que contienen bien una de las palabras entradas, bien la otra, bien ambas. Se trata de la unin de las pginas que contienen los trminos deseados. Suele simbolizarse por el operador OR. Operador I NO:permite eliminar ciertas pginas que contengan una palabra no deseada. Suele simbolizarse por el operador NOT, o bien AND NOT o tambin el signo -. Parntesis:permite encadenar varios operadores booleanos. Truncamiento:posibilidad de utilizar comodines simbolizados generalmente por *. Estos permiten escribir slo una parte del trmino deseado. A menudo solo se puede aplicar al final de la palabra. Adyacencia:posibilidad de buscar dos palabras una al lado de otra. Suele simbolizarse por comillas o con el operador ADJ Proximidad:posibilidad de encontrar palabras que estn geogrficamente cercanas unas de otras sin necesidad de ser adyacentes. Normalmente se simboliza por el operador NEAR.Cuando un usuario introduce una palabra clave el sistema no se conecta en tiempo real a todos los servidores sino que efecta sus bsquedas en el interior de las pginas que anteriormente ha almacenado en sus peregrinaciones por la Web. Puede ocurrir por tanto que una informacin actualizada diariamente en la Web est presente en una sede Web, pero no se encuentre por medio del motor ya que este habr capturado sus informaciones la semana anterior.Los motores de bsqueda son ms o menos potentes, bien por el nmero de pginas indexadas por adelantado, bien por la posibilidad de enlazar las palabras clave por medio de operadores booleanos distintos, o bien por un cierto nmero de opciones que veremos ms adelante. Un Metaservidor no utiliza servicios booleanos especficos, sino los del servicio que indexa.La indexacin de las pginas se efecta a travs de un robot lgico desarrollado por Digital. Se considera como palabra en una pgina toda serie de letras y/o cifras separada de otra palabra por un espacio, un signo de puntuacin o un carcter no alfabtico. Los signos de puntuacin no se indexan.Bsqueda simple: Search: permite efectuar bsquedas en pginas Web o en Usenet. Display The Results: da lo opcin de obtener los resultados de las bsquedas bajo distintos aspectos ms o menos detallados. Formato de palabras clave: Si escribe en minscula busca mayscula y minscula en cualquier posicin. Si escribe alguna letra en maysculas busca la ocurrencia exacta. Los acentos siguen las mismas reglas que en los casos anteriores. Permite comodines con restricciones: detrs de la tercera letra, sustituye de cero a cinco letras, slo minsculas, las maysculas y cifras no se tienen en cuenta. Bsqueda de palabras adyacentes separadas por; o con comillas separadas por espacio. Signo + para AND y signo para O. Pueden combinarse todas las posibilidades anteriores.Bsqueda avanzada:Permite realizar bsquedas asociando palabras clave con operadores booleanos y parntesis. Son posibles los operadores AND (&), OR (|), NEAR (~) y NOT (). Adems es igual escribir en maysculas que en minsculas.

10 pasos para una mejor bsqueda en InternetFase 1: Planificacin1.-Pensar antes de buscarAl realizar una bsqueda en la Red, no ingreses lo primero que se te ocurra en Google. Dedica un tiempo a planificar tu bsqueda. Esto te ayudar a encontrar resultados que ahorrarn tiempo a la hora de escribir tu ensayo y facilitarn la obtencin de una buena calificacin.

Si apresuras la bsqueda sin tener un plan previo, terminars seleccionando los mismos resultados una y otra vez, y finalmente escogiendo resultados que no son realmente tiles. Los resultados poco satisfactorios de una bsqueda causarn que pierdas tiempo al escribir tu ensayo, y significarn finalmente una calificacin baja.

Por eso, planea para alcanzar el xito. Re-escribe la tarea en tus propias palabras. Luego, haz una lista de trminos de bsqueda claves, y crea una serie de trminos que puedes buscar en combinaciones de dos, tres o ms. Cuando encuentres un buen resultado, busca las palabras ms importantes dentro de l, y luego adelas a tu lista. Prueba con una serie de combinaciones de palabras claves, revisa los resultados de cada una y luego selecciona las mejores, utilizando los criterios expuestos en los pasos 7-10 a continuacin.

Tambin, mantn un recuento de los sitios que has revisado. Esto ayudar a evitar pasar nuevamente por sitios poco satisfactorios y tambin ayudar a citar cada fuente utilizada apropiadamente.2.-Haz que los motores de bsqueda trabajen para tSi tu tarea es explicar cmo las guilas calvas fueron salvadas de la extincin, e ingresas el termino guilas en el motor de bsqueda, encontraras mucha informacin sobre

Un equipo de ftbol de Philadelphia; Una banda de rock de California Otros tipos de guilas; y Artculos sobre guilas no relacionados para nada con la extincin.

Si ingresas una sola palabra o una pregunta en la barra de bsqueda, no estas utilizando todo el poder del motor de bsqueda para encontrar informacin. Utiliza combinaciones de varias palabras claves. Luego, en la mayora de los motores de bsqueda, es posible limitar tu bsqueda utilizando palabras comunes como Y, O, NO o utilizando comillas para indicar que ests buscando una frase exacta. Si buscas (guilas calvas Y extincin NO ftbol), probablemente no obtendrs resultados sobre un equipo de ftbol, una banda de rock o las guilas doradas.3.-No creas todo lo que leesSe escptico!, ya que querrs encontrar la mejor informacin posible, en vez de lo primero que se vea bien o suene bien. Cualquier persona puede publicar algo en la Red, de forma barata y fcil. Muchos resultados de bsqueda sern poco crebles o completamente irrelevantes.

Siempre verifica la informacin confirmando con mltiples fuentes. Si encuentras que varios sitios Web no relacionados y crebles estn de acuerdo sobre un tema, tu bsqueda puede haber llegado a su fin. Este no sera el caso si lees algo solamente una vez.Fase 2: Decidiendo dnde buscar4.- Los motores de bsqueda no son siempre los mejores lugares para comenzar una bsqueda en lneaPrimero que nada, deberas estar usando la Red en primer lugar? Muchas escuelas ofrecen acceso a notables bases de datos que pueden ser un lugar mucho mejor para comenzar una investigacin. Puede que sean ms difciles de comenzar a usar, pero pueden ayudarte a encontrar la informacin creble que necesitas ms rpidamente que cualquier motor de bsqueda en lnea.

Cuando se trata de la Red, pregunta a una bibliotecaria o profesora si pueden recomendar una lista de sitios Web para revisar primero, o revisa en el sitio Web de tu escuela. Puede haber entre tres y cinco sitios Web que cubren tu tema en profundidad, y puedes ahorrar mucho tiempo buscando solamente en estos sitios.5. Prueba con varios motores de bsqueda, no solamente unoUtiliza varios motores de bsqueda. Aunque los grandes motores de bsqueda comerciales suelen ofrecer resultados similares, su forma de operar es lo suficientemente distinta como para utilizar varios de ellos para cada proyecto de investigacin para ayudar a descubrir recursos diferentes. Intenta con un meta-motor de bsqueda, que revisa varios motores de bsqueda al mismo tiempo.

Siempre deberas comenzar con el motor de bsqueda ms adecuado para tu bsqueda que no siempre resulta ser Google. Los motores de bsqueda especializados suelen revisar un grupo especifico de sitios Web, o utilizan mtodos diferentes para investigar la Red, por lo que casi siempre generarn resultados mejores y ms especficos en categoras particulares.6. Busca en profundidad; los mejores resultados no son siempre los primerosLos mejores resultados suelen no estar al principio de la pgina ni incluso en la primera pgina. Algunos sitios Web son muy buenos a la hora de hacer que su contenido aparezca al principio de las listas en los motores de bsqueda, por razones que no tienen nada que ver con la calidad de este contenido. Por lo tanto, los resultados que aparecen al principio de una lista de resultados pueden no ser tiles, mientras que los excelentes sitios que harn que tu ensayo destaque pueden estar varias pginas despus. Por eso, busca ms all de los primeros resultados e incluso de las primeras pginas. Busca en profundidad!Fase 3: Evaluando tus resultados7. Estas evaluando una fuente primaria? Por qu no?Los mejores recursos de investigacin que puedes encontrar en lnea sern fuentes primarias, tales como recuentos de revistas o peridicos o letras, diarios, pelculas o fotografas escritas o grabadas al momento del evento. Con las fuentes primarias, no tendrs que preocuparte de que la informacin se vea distorsionada entre una interpretacin y otra.8. Quin cre el sitio Web y escribe sus artculos? Por qu?Encontrar informacin en la Red es como ser un buen detective policial: la informacin es solamente tan buena como su fuente. Y, como buen detective, un buen investigador de la Red jams decide utilizar informacin sin considerar quin se la entreg. Se pregunta, Quin cre este sitio Web, y quin es el autor del contenido que estoy leyendo?

Cuando visites un sitio Webm revisa la pgina principal y la seccin Sobre Nosotros para determinar de lo que el sitio se trata realmente. Si el sitio no lista el nombre del editor y el equipo de administraciny este suele ser el casoabandona el sitio y visita otro. Jams confiaras en un libro sin conocer su autor y editor; por qu confiar en un sitio Web sin tener esa misma informacin? Tambin, busca informacin sobre el editor o autor buscando sus nombres en un motor de bsqueda. Cualquier editor o autor creble debera ser mencionado en otros sitios Web de buena reputacin.

Muchos tutoriales de la Red te indicaran que revises el dominio de alto nivellas letras al final de una direccin Web, tales como .com, .edu, .gov y .org. Durante la primera era de la Red, los sitios que terminaban en .edu, .org y .gov generalmente podan ser consideradas confiables.

Un signo de alerta que hemos descubierto en nuestro trabajo es que los sitios Web cuyo nombre describe su producto no suelen ser confiables. Muchos de los nombres de estos sitios Web fueron comprados hace mucho tiempo por personas cuyo inters primario en operar su sitio Web es vender productos, no ofrecer informacin creble. Por lo que ten especial cuidado al evaluar un sitio Web cuy nombre incluya palabras como gratis/descuento/mejor/tu/parati/Web.

Cuando encuentras contenido en Wikipedia, sabes quin lo escribi? No, no lo sabes. Los contribuyentes de Wikipedia son annimos; no se sabe nada sobre ellos ni sus credenciales. Puede ser un buen lugar para conducir tu investigacin previa y encontrar palabras claves que buscar,

Como un detective policial te dira, una vez que descubres quin, debes descubrir sus motivos. Quiere este sitio venderte algo? Tiene este sitio prejuicios sociales o polticos? Estos factores pueden intervenir en el tipo de informacin que el sitio ofrece y evita, y si esta informacin contiene un prejuicio infundado o una visin objetiva de un tema. En nuestras investigaciones, hemos descubierto ciertos de sitios Web que parecen ofrecer informacin valida pero fueron realmente creados con otro propsito.9. Cundo fue la informacin escrita o revisada por ltima vez?Ya que los eventos se desarrollan durante horas, das o semanas, las historias suelen variar bastante. Lo que una fuente dice sobre un descubrimiento cientfico, una persona viva, una guerra, una nueva tecnologa o muchas otras cosas puede volverse falso rpidamente. Por eso, siempre revisa las fechas de tus recursos. Si no puedes darte cuenta de cundo fue escrito un artculo, sigue buscando hasta encontrar una buena fuente sobre el tema que tenga una fecha reciente, para que puedas ver si algo ha cambiado. Siempre utiliza un nuevo motor de bsqueda para ver si hay algn desarrollo posterior, y realiza una bsqueda con el ao actual como uno de los trminos. Utiliza las opciones de bsqueda avanzada para encontrar resultados recientes.

Por otro lado, si estas escribiendo sobre un tema histrico, deberas asegurarte de incluir documentos de primera fuente, tales como peridicos y recuentos en revistas escritos al momento del evento. Si un evento ocurri en julio de 1950, entonces las fuentes escritas en ese mes pueden ofrecer informacin ms precisa sobre lo que ocurri que una fuente escrita hoy, 62 aos despus.10. Estn los avisos claramente diferenciados en el sitio, o se hacen pasar como informacin?Muchos sitios Web crebles tienen avisos publicitarios, pero cuando los avisos comienzan a verse mezclados con el contenido del sitio, puedes encontrar que el contenido no es confiable. Al igual que un infomercial en televisin es un aviso publicitario disfrazado de informacin, algunos sitios Web crean informacin pensada solamente para vender un producto.