차례:
정의-Apache Lucene은 무엇을 의미합니까?
Apache Lucene은 Java를 사용하여 완전히 작성된 고성능의 모든 기능을 갖춘 텍스트 검색 엔진 라이브러리를위한 오픈 소스 프로젝트입니다.
문서 내에서 전체 텍스트를 검색 할 수 있으므로 특히 크로스 플랫폼 인 경우이 기능이 필요한 모든 응용 프로그램에 적합한 기술입니다.
1999 년 Doug Cutting이 처음 개발했으며 2001 년 9 월 Apache Foundation Jakarta 오픈 소스 Java 프로젝트 제품군의 일부가되었습니다. 2005 년 2 월 최상위 Apache 프로젝트로 업그레이드되었습니다.
Techopedia는 Apache Lucene을 설명합니다.
Apache Lucene은 핵심 논리 아키텍처에서 "텍스트 필드를 포함하는 문서"라는 개념을 갖춘 고성능 검색 엔진입니다. 이는 뛰어난 유연성을 제공하며 Lucene API가 모든 파일 형식과 독립적이되도록합니다.
텍스트 정보를 추출 할 수있는 한 MS Word, HTML, XML, PDF 및 OpenDocument와 같은 형식의 모든 텍스트를 인덱싱 할 수 있으므로 이미지로는 아무 것도 수행 할 수 없습니다.
Lucene은 전체 텍스트 인덱싱 및 검색 기능이 필요한 모든 응용 프로그램에 적합하지만 인터넷 검색 엔진을 구현하고 로컬 단일 사이트 검색을위한 훌륭한 유틸리티로 널리 알려져 있습니다.
특징은 다음과 같습니다.
- 확장 가능한 고성능 인덱싱-최신 하드웨어에서 시간당 150Gb 이상을 처리 할 수 있으며 메모리 힙당 1Mb 만 필요합니다.
- 강력하고 정확하며 효율적인 검색 알고리즘-구문, 와일드 카드, 근접성 및 범위 쿼리와 같은 다양한 유형의 강력한 쿼리를 제공합니다. 또한 모든 필드를 기준으로 검색 및 정렬을 수행했습니다.
- 크로스 플랫폼-순수한 Java 구현이며 다른 프로그래밍 언어로도 제공됩니다.