대규모 검색 : lucene 과 solr
DESCRIPTION
대규모 검색 : Lucene 과 Solr. Search Engine 이란 ? 문서 Index 구성 후 이를 이용해 검색 Indexing 절차 : 문서변환 > Metadata 추출 > 텍스트 정규화 > (inverted) index 기록 Apache Lucene 및 관련 프로젝트 Lucene Java 2.2 = indexing 및 검색 용 Java 라이브러리 - PowerPoint PPT PresentationTRANSCRIPT
대규모 검색 : Lucene 과 Solr• Search Engine 이란 ?
– 문서 Index 구성 후 이를 이용해 검색– Indexing 절차 : 문서변환 > Metadata 추출 > 텍스트 정규화 > (inverted) index 기록
• Apache Lucene 및 관련 프로젝트– Lucene Java 2.2 = indexing 및 검색 용 Java 라이브러리– Solr 1.2 = http 기반의 index 및 검색 서버 (Web Application)
– Nutch 0.9 = Internet search engine software
– Hadoop = 분산 컴퓨팅 플랫폼 (Map/Reduce)