internet i systemy wyszukiwania - uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/wi_2.pdf ·...

44
Internet i systemy wyszukiwania Dr Agnieszka Nowak-Brzezioska

Upload: others

Post on 14-Jul-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Internet i systemy wyszukiwania

Dr Agnieszka Nowak-Brzezioska

Page 2: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Idea wyszukiwania informacji:

„Wyszukiwanie informacji to proces wyszukiwania w pewnym zbiorze tych wszystkich dokumentów,

które poświęcone są wskazanemu w kwerendzie tematowi (przedmiotowi) lub zawierają niezbędne

dla użytkownika fakty i informacje.”

Page 3: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Statystyki najnowsze

• Według danych podanych przez comScore World Metrix(http://www.comscore.com/), w grudniu 2008 roku liczba internautów przekroczyła próg miliarda.

• Największa liczba użytkowników została zarejestrowana w Azji - 41proc. wszystkich internautów. Na drugim miejscu znalazła się Europa - 28 proc., a na kolejnych Ameryka Północna - 18 proc., Ameryka Łacioska - 7 proc. oraz Bliski Wschód i Afryka - 5 proc.

Wśród krajów, najwięcej internautów zarejestrowano w Chinach - blisko 180 milionów, 18 proc. wszystkich użytkowników w świecie. Na drugim uplasowały się Stany Zjednoczone - 16,2 proc. udziału. Na kolejnych miejscach: Japonia - 6 proc., Niemcy - 3,7 proc. i Wielka Brytania - 3,6 proc.

Page 4: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)
Page 5: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Ranking domen wyszukiwarek, z których trafiają na polskie witryny internauci łączący się z obszaru Polski. Ranking jest tworzony na podstawie procentowej liczby wizyt rozpoczętych wejściem z wyszukiwarek na witryny uwzględnione w badaniu gemiusTraffic.

Page 6: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Google odnotowuje ponad 37 miliardów wyszukiwao w ciągu miesiąca. Kolejny w stawce Yahoo! Search ma tylko 22% udziałów w rynku (8,5 mld zapytao). Następne są Live Search (dawniej MSN Search, 7,5% - 2,2 mld) i Ask.com (4,8% - 1,4 mld). Słabe wyniki mają także największe nieanglojęzyczne wyszukiwarki - chioska Baidu(3,3 mld) i południowokoreaoska NHN (2 mld). W Polsce dominacja Google jest jeszcze większa. Według firmy Gemius, najpopularniejsza na świecie wyszukiwarka posiada nad Wisłą 88% udziału w rynku (dane za listopad 2007 r.). Drugi na liście Onet ma zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%). Polska witryna Google jest najpopularniejszą stroną w naszym kraju - może pochwalid się prawie 11 milionami użytkowników i ponad dwoma miliardami odsłon miesięcznie.

Page 7: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Trochę historiiPierwszym narzędziem wykorzystywanym do przeszukiwania sieci był Archie. Stworzył go w 1990 roku kanadyjski student Alan Emtage. Mechanizm pobierał listy zasobów ze wszystkich ogólnodostępnych serwerów FTP, nie analizował jednak zawartości plików. Dlatego wiele zależało od tego, jak dokładne były nazwy tych ostatnich. Popularyzacja protokołu Gopher zaowocowała powstaniem Veroniki i Jugheada. Działały na podobnej zasadzie co Archie.Pierwszą wyszukiwarką z prawdziwego zdarzenia był Wandex, który opierał się o robota World Wide Web Wanderer (tłum. Wędrowiec) stworzonego przez MatthewaGraya z Massachusetts Institute of Technology (MIT) w 1993. W tym samym roku pojawił się Aliweb, a nieco później Lycos i WebCrawler (wszystkie istnieją do dziś). W 1995 r. rozpoczęła się era AltaVisty i Excite’a, które rywalizowały z Yahoo! (wtedy jeszcze serwis ten był katalogiem stron). Wraz z początkiem XXI wieku dominującą pozycję zaczęło zdobywad Google.

Page 8: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Liderzy

• Google

• Yahoo! Search (kiedyś tylko katalog, dziś cały portal) http://search.yahoo.com/

• Ask (http://www.ask.com) (dawny Ask Jeeves)

Page 9: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Zaletą Yahoo! jest funkcja Search Assist. Znajduje ona podobieostwa między wynikami wyszukiwania a innymi, pokrewnymi stronami.

Page 10: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Internet stał się ogromnym zasobnikiem informacji(artykułów naukowych, popularno-naukowych, książek adresowych, telefonicznych, map geograficznych, wykazów usług sprzedaży, informacji o osobach, firmach, produktach itd..) oraz wszelkiego rodzaju usług (sprzedaży towarów, zbierania informacji, rezerwacji i sprzedaży biletów lotniczych, kolejowych, prezentacji filmów na zamówienie).

Wydaje się, że minął okres rozwoju wyszukiwarek ogólnego przeznaczenia, które indeksowały wszelkie możliwe strony WWW dostępne w Internecie: na polu walki pozostało tylko kilka znaczących wyszukiwarek. Niewątpliwą wadą tych systemów była powierzchowniowośd dokonywanego przez nie przetwarzania danych, wynikająca z ograniczeo na czas przetwarzania.

Dzisiaj spore szanse rozwojowe mają wyszukiwarki specjalizujące się w określonych dziedzinach zastosowao, gromadzące informacje w wąskiej dziedzinie. Nazywa się je wyszukiwarkami dedykowanymi. Dają one o wiele lepsze, pełniejsze i trafniejsze wyniki niż wyszukiwarki i katalogi ogólne. Są także specjalne wyszukiwarki do zdjęd (http://image.altavista.com/), lub kamer internetowych (http://www.earthcam.com), artykułów naukowych (http://citeseer.nj.nec.com).

Internet a systemy wyszukiwawcze

Page 11: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Nowe trendy•wyszukiwarki dedykowane•specjalizowane inteligentne wyszukiwarki (wspomagające wykrywanie przestępstw w Internecie (poszukiwanie ofert pornografii dziecięcej, nielegalnej sprzedaży towarów, przygotowania zamachów i blokad ulicznych, identyfikacja handlu żywym towarem))• wyszukiwarki z technikami analizy morfologicznej , składniowej, rozumienia tekstu, tłumaczenia tekstu.•Dąży się do realizacji zdolności do przetwarzania informacji multimedialnej: odnajdywania podobieostw i indeksacji obrazów, również filmów, dokumentów audio.

Page 12: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

•Oświecone zgadywanie•Katalogi stron (directories, indexes)•Przewodniki i specjalizowane katalogi przedmiotowe, bazy wiedzy. Itp.•Portale, wortale, „strony startowe”•Wyszukiwarki (szperacze) indeksujące•Metawyszukiwarki

Metody przeszukiwania WWW

Page 13: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Katalogi stron

•Katalog jest systemem klasyfikowania stron przeznaczonym do dokumentowania adresów internetowych.•Katalogi tworzone są przez ludzi•Katalogi tworzone są w oparciu o informacje dostarczane przez internautów.•Katalogi same się nie uaktualniają .Jeśli chce się zmienid opis w katalogu należy to zgłosid do redaktorów katalogu. Różne katalogi zachowują się różnie w zakresie klasyfikacji stron, przyjmowanych danych oraz sposobu wyświetlania wyników wyszukiwania.

Najpopularniejsze wyszukiwarki i katalogi

AltaVista Wyszukiwarka

AOL Search Katalog

Excite Wyszukiwarka

HotBot Wyszukiwarka

Go.com Wyszukiwarka

Google Wyszukiwarka/ katalog

Infoseek Wyszukiwarka

Lycos Katalog

MSN.com Katalog

Open Directory Katalog

Snap.com Katalog

Web Crawler Wyszukiwarka

Yahoo Katalog

Katalog jest drzewiastą strukturą, w którą szukający się zagłębia. Witryny przypisane są, ze względu na swoją zawartośd do poszczególnych kategorii, które dzielą się na kategorie podrzędne.Drzewiasta struktura przypomina drzewo katalogów i podkatalogów eksploratora Windows. Na koocu tej struktury znajdują się strony zawierające odsyłacze internetowe do konkretnych witryn.

Page 14: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Redaktorzy katalogów

•„Humans Do it Better” - oczywiście w porównaniu z robotami.•Aby znaleźd się w katalogu Internetowym należy przy zgłoszeniu wybrad kategorię, która najbardziej odpowiada treści strony. Należy podad adres strony, z jej krótkim opisem, czasem także kilka słów kluczowych dla strony. •Następnie redaktorzy katalogu odwiedzają zgłoszoną stronę, aby zbadad, czy jest warta umieszczenia w katalogu, badane jest zgodnośd opisu i słów kluczowych z treścią strony i w przypadku braku uwag strona dodawana jest do sugerowanej przez właściciela kategorii. •Jeśli redaktor uzna, że strona nie jest warta umieszczenia w katalogu - nic nie można na to poradzid. •Proces recenzowania stron trwa od kilku do kilkunastu dni - przy dlaszymburzliwym rozwoju Internetu będzie się wydłużał.•Wyniki wyszukiwania, które pokazuje katalog są oparte na krótkim opisie zamieszczonym w katalogu - meta tagi stron WWW nie mją znaczenia.

Page 15: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)
Page 16: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)
Page 17: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Wady i zaletyWady:• mała liczba zawartych w nich stron w porównaniu z innymi narzędziami. Powodem są ludzkie możliwości - dokładne przejrzenie witryny i zakwalifikowanie jej do odpowiedniej kategorii.•aktualizacja katalogu. Strony internetowe „żyją” ! a weryfikacja ich zawartości wymaga ponownego odwiedzenia ich przez redaktora. •różna interpretacja świata przez ludzi. Tą samą stronę dwie osoby mogą umieścid w różnych kategoriach.

Zalety:• opracowują je ludzie którym zależy na wiarygodności umieszczonych w nich danych. Możemy więc mied pewnośd, że ktoś za nie odpowiada.

Page 18: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

specjalizowane katalogi przedmiotowe

Page 19: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

YASE (yet another search engine)Ich celem było stworzenie wyszukiwarki dziedzinowej działającej na pojedynczym komputerze klasy PC ze skrajnie niskimi zasobami i o mocami obliczeniowymi. W internecie możemy spotkad szereg wyszukiwarek dziedzinowych dedykowanych tj:- CNET.com – specjalizująca się w dziedzinie komputerów,-Wyszukiwarka University of pennsylvcania przeszukująca strony tej uczelni (http://www/upenn.edu/) - - specjalizowana wysz. Lycos wspomagająca wyszukiwanie plików typu mp3 (http://mp3.lycos.com)- - wyszukiwarka YASE dla publikacji nt. bd (http://mykerinos.cis.upenn.edu)-Wyszukiwarka zdjęd http://image.altavista.com

specjalizowane katalogi przedmiotowe

Page 20: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Specjaliści w natarciu

1. http://www.technorati.com (świat blogów: prawie 100 mln)2. wyszukiwarki aktualności: http://www.newslookup.com (opensource'owy serwis

Newslookup . Mechanizm witryny przeszukuje kilka tysięcy źródeł wiadomości z całego świata. Pozwala na zawężenie wyników do gazet, telewizji, radia lub sieci. Istnieje także możliwośd określenia geograficznego obszaru, z którego pochodzi wiadomośd)

3. http://www.picsearch.com (grafika, pliki audio i wideo). Picsearch powstał w 2000 roku i obecnie indeksuje 2 mld obrazków - więcej niż Yahoo! Search (1,6 mld) i niewiele mniej niż Google (2,2 mld).

Page 21: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Wyszukiwarki specjalizowaneBlinkx (wideo) http://www.blinkx.comBlogscope (blogi) http://www.blogscope.netBusiness.com(firmy) http://www.business.comEx.pl/ode.us (ludzie) http://ex.pl, ode.usFileSearch (pliki) http://www.filesearching.comIceRocket (blogi) http://www.icerocket.comInfoSpace (firmy, ludzie) http://www.infospace.comKelkoo (ceny) http://www.kelkoo.comLexis Nexis (prawo) http://www.lexisnexis.comMagPortal (newsy) http://www.magportal.comNewslookup (newsy) http://www.newslookup.comOmgili (fora) http://www.omgili.comPicsearch (grafika) http://www.picsearch.comPriceRunner (ceny) http://www.pricerunner.comRollyo (wysz. spersonalizowana) http://rollyo.comSphere (blogi) http://sphere.comSpock (ludzie) http://www.spock.comTechnorati (blogi) http://www.technorati.comThomasNet (firmy) http://www.thomasnet.comTopix (newsy) http://www.topix.comWink (ludzie) http://wink.com

Page 22: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Inne specjalistyczne wyszukiwarki

•serwisy medyczne dostarczające informacji o lekach i firmach farmaceutycznych, przeznaczone dla lekarzy lub pacjentów (Searchmedica, Bioinformatic Harvester, Entrez, Healia),

•strony poświęcone nieruchomościom, pozwalające wyszukiwad oferty i wystawiad domy czy mieszkania na sprzedaż (Home.co.uk, Rightmove, Zillow),

•witryny oparte o przeszukiwanie map i znajdywanie obiektów geograficznych (Geoportail - tylko Francja, MapQuest, Google Maps, Yahoo! Maps),

•serwisy dla osób poszukujących pracy (Career-Builder, Hotjobs, Monster, Recruit),

•usługi przeszukujące kod open source, przeznaczone dla programistów i twórców stron WWW (Koders, Krugle, JExamples).

Page 23: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Portale, wortalePortal internetowy – internetowy serwis informacyjny poszerzony o różnorodne funkcje internetowe, dostępny z jednego adresu internetowego. W intencji twórców, ma to zachęcad użytkowników do ustawienia adresu portalu jako strony startowej w przeglądarce www i traktowania go jako bramy do Internetu. Zazwyczaj portal zawiera informacje będące przedmiotem zainteresowania szerokiego grona odbiorców. Jako przykładową treśd portalu można podad: dział aktualnych wiadomości, prognoza pogody, katalog stron WWW, czat, forum dyskusyjne oraz mechanizmy wyszukiwania informacji w nim samym lub w zewnętrznych zasobach Internetu (wyszukiwarki internetowe).W celu przyciągnięcia większej ilości użytkowników portale mogą oferowad darmowe konta poczty elektronicznej, miejsce na strony WWW i dostęp do innych usług (np. multimedia, pobieranie plików, grupy dyskusyjne).

Polskie portaleOnet.plWirtualna PolskaInteria.plO2.pl

Portale na świecieYahooSeznam.czAOL

Page 24: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Wortal, portal wertykalny (ang. vertical portal) – portal wyspecjalizowany, publikujący informacje z jednej dziedziny, tematycznie do siebie zbliżone, np. dotyczące muzyki, filmu, programów komputerowych.Nazwa ma stanowid przeciwstawienie do zwykłego portalu, obejmującego szeroki zakres tematyczny (horyzontalnego), a przy okazji podkreślad wyższą jakośd udostępnianych zasobów, jednak nie przyjęła się szeroko.

Wortal jest odpowiednikiem portalu, tyle, że poświęconemu konkretnej tematyce. Przykłady wortali:pclab.plbenchmark.pl

Portale, wortale

Page 25: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Wyszukiwarki (szperacze) indeksujące•Bardziej wydajne niż katalogi. •Tworzą automatycznie swoje bazy danych o witrynach. •Oprogramowanie wyszukiwarki składa się z dwóch oddzielnych modułów:1. pierwszy odwiedza witryny internetowe, analizując umieszczone na nich teksty, oraz

podąża za odsyłaczami hipertekstowymi do kolejnych stron. 2. Indeks - obsługuje powstającą w ten sposób bazę danych. Korzystanie z bazy polega

na wpisywaniu poszukiwanych słów i obejrzeniu wyświetlonych wyników w postaci hipertekstowych odsyłaczy do stron, które zawierają wpisane wyrażenie. Jako pierwsze wyświetlane są adresy witryn, które bardziej odpowiadają zadanemu pytaniu.

Page 26: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Wyszukiwarki tekstowe - działanie

Oprogramowanie szperacza próbuje samodzielnie określid tematykę dokumentu i jego wartośd, co ma później wpływ na miejsce, które dany dokument zajmie w klasyfikacji odpowiedzi. Automatyczne wybieranie słów kluczowych z przeglądanych dokumentów polega na analizie umiejscowienia poszczególnych wyrazów i częstości ich powtarzania w stosunku do innych. Niestety nawet najlepszy program analizujący zawartośd stron WWW czasami nie potrafi poradzid sobie z zawiłościami ludzkiego języka - co prowadzi do błędów.

Wyszukiwanie według słów kluczowych Baza danych wyświetli nam listę stron, które zawierają poszukiwane słowo lub słowaWyszukiwanie rozmyte uwzględnia różne formy danego wyrazu. W pytaniu podajemy początek wyrazu pozostałą częśd zastępujemy znakiem ? lub *. Znak ? zastępuje tylko jedną literę, zaś * zastępuje większą ilośd znaków.Koniecznośd występowania wyrazu lub nieInną możliwośd dają nam dwa znaki + i -. Pierwszy wymusza na szperaczu wyświetlenie stron, które muszą zawierad wyraz poprzedzony +. Drugi zaś wyklucza strony zawierające dane słowo.

Page 27: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

MetawyszukiwarkiTo serwisy internetowe, które nie posiadają własnej bazy danych, ale potrafią wysład nasze zapytanie do kilku lub kilkunastu samodzielnych szperaczy, odebrad je od nich i przedstawid w przejrzystej formie.Wadą metawyszukiwarek jest brak dostępu do specyficznych zapytao złożonych jakie dają pojedyncze szperacze.Zaletą jest to, że można zadad jedno pytanie do kilku szperaczy przy odwiedzeniu tylko jednego serwisu. Zaoszczędza to czas i daje możliwośd przeszukania większej części zasobów Internetu. Niektóre metawyszukiwarki dodatkowo opracowują otrzymaną listę wyników: Usuwają powtarzające się adresy i te, które już nie istnieją w Internecie, a są jeszcze zapisane w bazie wyszukiwarki. Dodatkowo mogą sortowad na różne sposoby wyświetloną listę.

Page 28: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Firma Browsys proponuje wszystkim maniakom surfowania narzędzia o nazwieTwoogle oraz Twofind, które pozwalają na sprawdzanie wyników wyszukiwaniajednocześnie w kilku najpopularniejszych wyszukiwarkach internetowych.

Page 29: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Pierwsze z narzędzi o nazwie Twoogle to połączenie wyszukiwarki internetowej Google zserwisem mikroblogów Twitter. Możemy jednocześnie przeszukiwad obie strony. Co ciekawe,wyniki wyszukiwania prezentowane są w osobnych, sąsiadujących ze sobą oknach.

Page 30: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Twofind pozwala natomiast na konfrontację między Google, a niedawno zaprezentowaną wyszukiwarką Microsoftu, czyli Bing. Podobnie, jak Twoogle, wyniki wyszukiwania prezentowane są w dwóch osobnych oknach obok siebie, dzięki czemu możemy szybko porównad je ze sobą.

Page 31: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)
Page 32: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)
Page 33: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Test wyszukiwarki Wolfram Alpha

• Wolfram Alpha tak naprawdę niewiele ma wspólnego z tym, co znamy jako wyszukiwarki. To raczej wielka baza wiedzy, której możemy używad w dowolny sposób.

• System komputerowy wyposażony w 4608 procesorów wspomaga działanie nowej wyszukiwarki.

• unikalną cechą Wolfram Aplha jest algorytm, który zamiast wyświetlad spis witryn internetowych stara się podad gotową odpowiedź na zadane przez użytkownika pytanie.

• Wada: często źle wyszukuje informacje

• Zaleta: jeśli wpiszemy nazwę jakiegoś polskiego miasta, wyszukiwarka wyświetli je na mapie (z możliwością przejścia do widoku satelitarnego Google Maps), poinformuje o lokalnym czasie czy aktualnej pogodzie. To już nam bardziej przypadło do gustu.

• Wolfram wykona dla nas skomplikowane obliczenia (z zakresu matematyki czy fizyki), dokona ciekawych porównao (na przykład PKB paostw), a nawet sprawdzi ile kalorii ma posiłek, który mamy zamiar dziś zjeśd. Wszystko przedstawi na wykresach.

• Wyszukiwarka ze sztuczną inteligencją (dzięki mechanizmom sztucznej inteligencji, wyszukiwarka próbuje interpretowad pytanie i udziela odpowiedzi.)

Page 34: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Jak Wolfram działa w praktycejaki był produkt krajowy brutto (PKB) na osobę w Polsce w 1998 roku?

Page 35: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Jak Wolfram działa w praktyce

Jaka była pogoda w styczniu tego roku w Poznaniu?

Page 36: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)
Page 38: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Wolfram przedstawia również dane dotyczące stron internetowych - liczbę odwiedzin na witrynie. Należy wpisad po prostu adres strony i otrzymamy wynik.

Page 39: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)
Page 40: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

Google Squared - wyniki wyszukiwania w tabeli

Page 41: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

WPIS TESTOWY: Microsoft AppleWOLFRAM ALPHA: Wyskoczyły tabele i wykresy giełdowe oraz dane na temat obu firm.GOOGLE: Najwyżej na liście były newsy na temat obu firm, od większych do mniejszych publikacji, zawierających oba słowa.WARIACJE: Kiedy zamieniono wpis na samo “Microsoft” lub “Apple,” wyskoczyły informacje na temat dzisiejszych cen akcji firm na giełdzie, po kliknięciu w linki dane były zbliżone do tego, co zaprezentował Wolfram, ale tylko dla pojedynczej firmy.

WPIS TESTOWY: Sydney New YorkWOLFRAM ALPHA: Wyskoczyły tabele pokazujące dystans między oboma miastami w milach, kilometrach, milach morskich, a także mapa świata z optymalnym połączeniem lotniczym, czasem lotu w różnych jednostkach czasowych i za pomocą różnych “środków komunikacji”. Oprócz tego były porównania ludności, powierzchni i czas lokalny.GOOGLE: Pokazało wiele różnych rzeczy. Oferty lotów z Sydney i Nowego Yorku; Google Maps wyrzuciło listę biznesów w Nowym Yorku mających w nazwie słowo “Sydney”; pojawiły się także linki do władz miasta Sindey znajdującego się w stanie Nowy York.WARIACJE: Kiedy wpisano “Sydney New York distance” Wolfram pokazał tylko dystans między miastami, Google zaś linki do stron pokazujących dystans między miastami. Pierwsza z nich pokazywała te informacje, co Wolfram jednak bez kilku jednostek.

http://vbeta.pl/2009/05/05/porownanie-wolfram-alpha-z-google-kto-zwyciezyl/

Page 42: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

WPIS TESTOWY: 10 pounds kilograms (10 funtów kilogram)WOLFRAM ALPHA: Otrzymano informację, że zostanie to zinterpretowane jako “10 funtów razy 1 kilogram”. Rezultat wynosił: 4.536 kg2 lub 22.05 lb2.GOOGLE: Google podało linki do stron z konwersjami miar.WARIACJE: Po dodaniu słowa ”in” (”10 pounds in kilograms”), wszytko się zmieniło. Wolfram podał poprawną odpowiedź: 10 funtów to 4.536 kilograma. Na koniec otrzymaliśmy informację, że 10 funtów to 1.8 razy więcej, niż waga książki Wolframa „A New Kind of Science”. Google zaś przeliczyło 10 funtów = 4.5359237 kilograma.Kiedy wpisano “10 lbs kgs,” Wolfram Alpha znów przemnożyło. Google zaś podał znów strony do konwersji miar.Przy wpisaniu “10 pds kgs,” Alpha nie zrozumiał, a Google zapytał się czy chodzi może o funty i podał znów strony do konwersji.

WPIS TESTOWY: light bulb (żarówka)WOLFRAM ALPHA: Dostaliśmy wpis, że nie jest pewien co pokazad.GOOGLE: Kilka stron zaczynając od Wikipedii, które traktowały o historii i wyjaśniały jak działa żarówka.WARIACJE: Po wpisaniu “light bulb inventor,” (wynalazca) Wolfram Alpha zachował się podobnie, Google zaś dostarczyło pomocnych linków. Przy wpisie “first light bulb,” Alphapodało wpis wyjaśniający, kiedy została ona opatentowana i pod wpisem “peopleinvolved,” wymieniła Thomasa Edisona.

Page 43: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

WPIS TESTOWY: Cancer New YorkWOLFRAM ALPHA: Zamiast statystyk zachorowalności na raka Wolfram podał informacje o konstelacji „Raka”. Pokazał także skąd w Nowym Yorku można zobaczyd na niebie ten gwiazdozbiór.GOOGLE: Pierwszy link był do Memorial Sloan-Kettering Cancer Center w Nowym Yorku. Drugi do strony New York State Department of Health’s. Trzeci do rejestru New York State Cancer Registry.WARIACJE: Po dodaniu drugiego stanu (Cancer New York Nevada) Wolfram nie wiedział o co chodzi, a Google pokazało pierwsze wyniki głownie z Nevady, różne historie, strony prawnicze, kliniki medyczne, bez żadnych porównao, czy informacji, które można było znaleźd osobno.

Page 44: Internet i systemy wyszukiwania - Uniwersytet Śląskizsi.tech.us.edu.pl/~nowak/wi/WI_2.pdf · 2013-08-28 · zaledwie 5%. Kolejne są Wirtualna Polska (2,7%) i Microsoft (1,1%)

WPIS TESTOWY: Utah Florida populationWOLFRAM ALPHA: Wykaz tabel porównujących populacje obu stanów od 2006 roku, wzrost populacji notowany od 2000 do 2006 roku i liczbę urodzeo oraz zgonów w 2004.GOOGLE: Mimo tego, że pokazano dane nawet o bezrobociu, nie były one aktualne.WARIACJE: Po wpisaniu ”Utah population,” Google pokazało prosty wykres populacji od 1980 roku do teraz. Po wpisaniu “Utah Florida,” Wolfram wykazał cały almanach pokazując informacje od populacji i powierzchni zaczynając, przez historię tych dwóch stanów, a na wykazach przychodów gospodarstw domowych koocząc. Google pokazał różne strony zawierające oba słowa, podając lokację na mapie miejsc biznesowych, które zawierają słowo “Utah.”

Nie było tutaj z jednej stronie bardzo życiowych pytao, które mogłyby sprawid Wolframowi dużo kłopotów, jednak nie mieliśmy też do czynienia z wpisami ścisłymi, gdzie świetnie sobie radzi (fizyka, chemia, inżynieria itp.) Przy dośd trudnych pytaniach ścisłych dowiemy się wiele jako badacze, ale częśd danych jest nieprzyswajalna dla większości użytkowników. Wiele oczywistych pytao może pozostad jednak bez odpowiedzi. Zobaczycie jednak sami za parę tygodni.