apache solr

Post on 17-Nov-2014

497 Views

Category:

Technology

3 Downloads

Preview:

Click to see full reader

DESCRIPTION

 

TRANSCRIPT

Apache SolrŠta je Apache Solr i pregled osnovnih

funkcionalnosti

Nikola Pajić

Zašto brza pretraga?

Pretraga je definisala današnji internet

Ogromna količina podataka

Kako doci do traženog podatka?

Upiti nad bazama – spori?

Apache SolrJedno od vodećih rešenja za brzu pretragu

Napravljen oko Lucene (Java) bibioteke za pretragu podataka

Proveren

Koriste ga Buy.com, AOL, CNET, Zappos, CIA, NASA, MTV, Netflix, Disney i mnogi drugi

Apache SolrPouzdanSkalabilanTolerantan na greškePodržava indexiranjePodržava replikacijuAutomatski recovery

FunkcionalnostiFull-text pretragaHit highlightingFaceted searchDatabase integrationRitch document handling

Ms Word, PDF, Images, Mp3, Zip, itd.AutocompleteMore like thisSpell checking

KonfiguracijaXMLCentralizovana i eksterna konfiguracijaNe zahteva poznavanje Java programskog

jezikaObavlja se preko 2 XML fajla

Kontrola runtime parametara (solrconfig.xml)Šema indeksiranja (schema.xml)

Predefinisana polja (float, int, text, double...) Korisnički definisana polja (ukoliko je to potrebno) Utice na indexiranje i kasnije rezultate pretrage

Schema.xml

Apache SolrSolr je Java web aplikacija

http://localhost:8983/solr/Komunikacija se odvija preko HTTP GET/POST

Nezavistan od platforme Pretraga se obavlja pre API-ja

Pretraga se obavlja korišćenjem Lucene biblioteke za pretragu texta

Index pretrageDokumenti koji sadrže odredjena polja pretrageJedan denormalizovan podatak

Apache SolrOptimizovan je za pretragu podatakaIndexiranje podataka i commit su sporiMože se svrstati kao NoSQL rešenjeDocument oriented pretraga

Svi podaci se nalaze u XML dokumentu optimizovanom za pretragu

Nema nikakav oblik zastite/sigurnostiOslanja se na sigurnost same platforme na

kojoj se nalazi

Podatak pretrage

IndexiranjeMože indeksirati i dokumente

MS Office, PDF, RTF, OpenDocument, Images, Mp3, Zip, itd...

Indexira textualni deo dokumentaKao i meta podatke vezane za dokument

Tip fajlaDatume kreiranja, menjanja, itd...AutoraSve što meta podatak može da sadrži

Pretragalocalhost:8983/solr/select?q=search string&start=50&rows=25&facet=on&facet.field=category&sort=category desc

RezultatiDefault format = XML&wt=json&wt=php&wt=ruby&wt=python

RezultatiXML JSON

RezultatiPHP Python

Query ParserNapredni upiti

Default parser, podržava napredne parametre pretrage

&deftype=luceneq=title: saint* AND zipcode:[2000 TO 2999]

Jednostavni upitiJednostavna sintaksa, idealan za korisničke

upite&deftype=dismaxq=title: ipod +shuffle –touch

Facets (drilldown)Grupisanje rezultataDinamička navigacija – EcommerceJednostavna pretragaRezultat uvek postojiSuper pretraživanje

Facets + Spell checking + “Mora like this”

Faceted search

Klasični “Advanced search”

Ostale funkcionalnosti- Spell checking - Hit highlighting

Ostale funkcionalnosti- “More like this” - Autocomplete

ImplementacijaJezično nezavistanHTTP komunikacija putem XML/JSONPostoje API klijenti za gotovo sve programske

jezikePHP – solr-php-client.NET - SolrnetJavascript – ajax-solrJava – SolrJRuby – SunspotPython - SolPython

Pitanja?

top related