대규모 검색 : lucene 과 solr

1
대대대 대대 : Lucene 대 Solr Search Engine 이이 ? 대대 Index 대대 대 대대 대대대 대대 Indexing 대대 : 대대대대 > Metadata 대대 > 대대대 대대대 > (inverted) index 대대 Apache Lucene 이 이이 이이이이 Lucene Java 2.2 = indexing 대 대대 대 Java 대대대대대 Solr 1.2 = http 대대대 index 대 대대 대대 (Web Application) Nutch 0.9 = Internet search engine software Hadoop = 대대 대대대 대대대 (Map/Reduce)

Upload: rosetta-ardill

Post on 01-Jan-2016

90 views

Category:

Documents


10 download

DESCRIPTION

대규모 검색 : Lucene 과 Solr. Search Engine 이란 ? 문서 Index 구성 후 이를 이용해 검색 Indexing 절차 : 문서변환 > Metadata 추출 > 텍스트 정규화 > (inverted) index 기록 Apache Lucene 및 관련 프로젝트 Lucene Java 2.2 = indexing 및 검색 용 Java 라이브러리 - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 대규모 검색 :  Lucene 과  Solr

대규모 검색 : Lucene 과 Solr• Search Engine 이란 ?

– 문서 Index 구성 후 이를 이용해 검색– Indexing 절차 : 문서변환 > Metadata 추출 > 텍스트 정규화 > (inverted) index 기록

• Apache Lucene 및 관련 프로젝트– Lucene Java 2.2 = indexing 및 검색 용 Java 라이브러리– Solr 1.2 = http 기반의 index 및 검색 서버 (Web Application)

– Nutch 0.9 = Internet search engine software

– Hadoop = 분산 컴퓨팅 플랫폼 (Map/Reduce)