apache solr
Post on 17-Nov-2014
497 Views
Preview:
DESCRIPTION
TRANSCRIPT
Apache SolrŠta je Apache Solr i pregled osnovnih
funkcionalnosti
Nikola Pajić
Zašto brza pretraga?
Pretraga je definisala današnji internet
Ogromna količina podataka
Kako doci do traženog podatka?
Upiti nad bazama – spori?
Apache SolrJedno od vodećih rešenja za brzu pretragu
Napravljen oko Lucene (Java) bibioteke za pretragu podataka
Proveren
Koriste ga Buy.com, AOL, CNET, Zappos, CIA, NASA, MTV, Netflix, Disney i mnogi drugi
Apache SolrPouzdanSkalabilanTolerantan na greškePodržava indexiranjePodržava replikacijuAutomatski recovery
FunkcionalnostiFull-text pretragaHit highlightingFaceted searchDatabase integrationRitch document handling
Ms Word, PDF, Images, Mp3, Zip, itd.AutocompleteMore like thisSpell checking
KonfiguracijaXMLCentralizovana i eksterna konfiguracijaNe zahteva poznavanje Java programskog
jezikaObavlja se preko 2 XML fajla
Kontrola runtime parametara (solrconfig.xml)Šema indeksiranja (schema.xml)
Predefinisana polja (float, int, text, double...) Korisnički definisana polja (ukoliko je to potrebno) Utice na indexiranje i kasnije rezultate pretrage
Schema.xml
Apache SolrSolr je Java web aplikacija
http://localhost:8983/solr/Komunikacija se odvija preko HTTP GET/POST
Nezavistan od platforme Pretraga se obavlja pre API-ja
Pretraga se obavlja korišćenjem Lucene biblioteke za pretragu texta
Index pretrageDokumenti koji sadrže odredjena polja pretrageJedan denormalizovan podatak
Apache SolrOptimizovan je za pretragu podatakaIndexiranje podataka i commit su sporiMože se svrstati kao NoSQL rešenjeDocument oriented pretraga
Svi podaci se nalaze u XML dokumentu optimizovanom za pretragu
Nema nikakav oblik zastite/sigurnostiOslanja se na sigurnost same platforme na
kojoj se nalazi
Podatak pretrage
IndexiranjeMože indeksirati i dokumente
MS Office, PDF, RTF, OpenDocument, Images, Mp3, Zip, itd...
Indexira textualni deo dokumentaKao i meta podatke vezane za dokument
Tip fajlaDatume kreiranja, menjanja, itd...AutoraSve što meta podatak može da sadrži
Pretragalocalhost:8983/solr/select?q=search string&start=50&rows=25&facet=on&facet.field=category&sort=category desc
RezultatiDefault format = XML&wt=json&wt=php&wt=ruby&wt=python
RezultatiXML JSON
RezultatiPHP Python
Query ParserNapredni upiti
Default parser, podržava napredne parametre pretrage
&deftype=luceneq=title: saint* AND zipcode:[2000 TO 2999]
Jednostavni upitiJednostavna sintaksa, idealan za korisničke
upite&deftype=dismaxq=title: ipod +shuffle –touch
Facets (drilldown)Grupisanje rezultataDinamička navigacija – EcommerceJednostavna pretragaRezultat uvek postojiSuper pretraživanje
Facets + Spell checking + “Mora like this”
Faceted search
Klasični “Advanced search”
Ostale funkcionalnosti- Spell checking - Hit highlighting
Ostale funkcionalnosti- “More like this” - Autocomplete
ImplementacijaJezično nezavistanHTTP komunikacija putem XML/JSONPostoje API klijenti za gotovo sve programske
jezikePHP – solr-php-client.NET - SolrnetJavascript – ajax-solrJava – SolrJRuby – SunspotPython - SolPython
Pitanja?
top related